Sprint 3 : oxford project API 尝试
本次Sprint我们大家主要在调研和尝试阶段,主要是对photo experience 中的语音接口部分进行相应的调研和分析。
工作进度:
1. 图像界面设计兆阳和敏龙的工作进一步推进,除去之前介绍的相应界面以外,拥有了Query suggestion 功能和缩略图的suggestion,进一步完善了整体界面的布局和设计。
2. 牛津语音接口方面,栋调研了接口的使用方法,并将样例代码进行了详尽的分析。并且和我们一起讨论,以相应文档形式给出。
3. 自然语言处理NLP是我们project的重要环节,audio to sentence 是语音API的工作,而sentence to query 则是NLP的工作。这部分由敏龙负责,并且已经实现了相应接口可供初步调试。
4. 算法整合方面,延东已经将基本的pipeline搭建完毕,能够顺利抽取CNN feature。拂尘则foucs在其他feature整合工作,实现较好的整体算法流程。
这次站会我们确立了接下来的Sprint4的具体工作内容,同时也是为alpha release 做最后的工作:
1. oxford api 调试工作,此项为敏龙和栋负责。
2. NLP处理以及query的提取工作,由敏龙和兆阳负责。
3. 在query to vector工作需要使用word vector词表,尝试使用词汇量较少但是比较general的model 完成手机客户端的移植,此项由拂尘和栋负责。
4. 完成后台服务的工作,此项为兆阳负责。
5. 提升search的精度,在vector词距的时候尝试使用其他算法,并且对multi-label的图片搜索进行算法改进。
期待下周结束能完成alpha release。
posted on 2015-12-05 19:31 MSRA_ASE_为道智能 阅读(253) 评论(0) 编辑 收藏 举报