|
|
## 实验室同学
|
|
|
### 多萝西(平台开发者)
|
|
|
#### 简介:
|
|
|
我是一个算法研究人员,从事推荐、认知诊断的算法研发。已经有一定的学术研究积累,并在不少离线数据集上进行了算法的研究与验证。现在迫切地想要一个线上平台接口能让我快速地进行线上的分析和验证,以进一步提升实验的可靠性和适用范围。同时也希望通过对线上平台进行数据分析,找出更多潜在的研究方向。
|
|
|
|
|
|
#### 需求:
|
|
|
* 当我使用线上平台接口接入自己的算法的时候,我希望接口可以尽可能的简单和统一,最好是能让我尽可能少地改动已有算法;同时线上平台可以提供统一、灵活的可视化监控工具,既提供一部分通用的工具,也可以让我快速定制化一些个性化的监控方式;更重要的是,我希望平台能够自动处理负载均衡、计算资源分配等底层问题,让算法可以高效运行;
|
|
|
* 当我使用线上平台的时候,我希望可以对用户群进行管理及其它定时功能。以 A/B test为例,我希望不仅可以指定用户数量,最好还可以指定划分方式,例如可以针对不同年级学生进行分层抽样,最好可以指定分层比例,同时可以指定测试时间,对不同分层、分组方式可以进行可视化监控。平台最好也可以提供详细的运行记录,最好可以有配套的可视化分析工具,方便我下载用户反馈数据和进行快速的在线分析;
|
|
|
因为有对在线数据进行分析的需要,所以我希望能把自己写的一些分析算法像插件一样快速接入到线上平台;
|
|
|
* 我希望平台能对数据和接口有一个详尽、充分的文档说明,然后是易查的,让我能在有一个新的想法的时候能很快知道哪些数据和接口是可用的;同时有一个好的反馈机制,能让我在需要某一个平台目前没有的特征时,能很快地有人加入这个特征;
|
|
|
* 希望平台对用户行为记录更详细,方便我对用户行为进行分析;最好可以提供一个离线版本的测试环境,甚至是一个仿真环境,用以进行实验;最好在这种环境中完成的代码可以无缝迁移到线上环境去。
|
|
|
|
|
|
#### 困难:
|
|
|
* 我担心上线算法过程繁琐,让人不知道从何下手,或者需要对自己的代码做很复杂的改动;
|
|
|
* 我担心想对线上数据做分析的时候,难以接入自己的个性化代码,或者接入自己的代码会要修改线上平台的代码,这样会很复杂;
|
|
|
* 我担心难以对算法进行评估,难以在线上线下效果出现较大差异的时候进行debug,也担心难以对bug进行追踪和复现;
|
|
|
* 我担心我想对线上数据进行分析的时候要面对海量的字段和文档,找不到合适的切入点,不知道怎么快速地确定和方向相关的数据和接口;
|
|
|
* 我担心平台记录的数据有限,反馈处理不及时,不能满足研究中动态变化的需求;
|
|
|
* 我担心直接进行线上实验可能存在风险,在线更新的算法可能面临着冷启动等问题,一些参数可能需要经过多次在线调试才能得到,调试过程可能给用户带来不好的体验。
|
|
|
|
|
|
## 内容分享者
|
|
|
### 米兰(教师)
|
... | ... | @@ -33,4 +47,7 @@ |
|
|
* 我害怕繁多的题目让我困惑,难以挑选对我有帮助的题目。
|
|
|
|
|
|
|
|
|
### 汉娜(求职提高者) |
|
|
\ No newline at end of file |
|
|
### 汉娜(求职提高者)
|
|
|
#### 简介:
|
|
|
#### 需求:
|
|
|
#### 困难: |