Sprint 3 : oxford project API 尝试

本次Sprint我们大家主要在调研和尝试阶段，主要是对photo experience 中的语音接口部分进行相应的调研和分析。

工作进度：

1. 图像界面设计兆阳和敏龙的工作进一步推进，除去之前介绍的相应界面以外，拥有了Query suggestion 功能和缩略图的suggestion，进一步完善了整体界面的布局和设计。

2. 牛津语音接口方面，栋调研了接口的使用方法，并将样例代码进行了详尽的分析。并且和我们一起讨论，以相应文档形式给出。

3. 自然语言处理NLP是我们project的重要环节，audio to sentence 是语音API的工作，而sentence to query 则是NLP的工作。这部分由敏龙负责，并且已经实现了相应接口可供初步调试。

4. 算法整合方面，延东已经将基本的pipeline搭建完毕，能够顺利抽取CNN feature。拂尘则foucs在其他feature整合工作，实现较好的整体算法流程。

这次站会我们确立了接下来的Sprint4的具体工作内容，同时也是为alpha release 做最后的工作：

1. oxford api 调试工作，此项为敏龙和栋负责。

2. NLP处理以及query的提取工作，由敏龙和兆阳负责。

3. 在query to vector工作需要使用word vector词表，尝试使用词汇量较少但是比较general的model 完成手机客户端的移植，此项由拂尘和栋负责。

4. 完成后台服务的工作，此项为兆阳负责。

5. 提升search的精度，在vector词距的时候尝试使用其他算法，并且对multi-label的图片搜索进行算法改进。

期待下周结束能完成alpha release。

posted on 2015-12-05 19:31 MSRA_ASE_为道智能阅读(253) 评论(0) 编辑收藏举报

刷新页面返回顶部

MSRA_ASE_为道智能