【牛津计划】拥抱机器学习，再次升级

原创 2015-11-12 牛津计划 微软研究院

微信公众号：微软研究院

今年上半年，微软发布了牛津计划——一个由API、SDK和服务构成的套件，可以帮助开发人员开发出更智能，交互更多样的应用。牛津计划是在微软一系列机器学习API组合的基础上扩展而来，藉由牛津计划，开发人员能够在他们的应用中轻松添加智能功能——例如视觉、语音、面部识别和语言理解等。牛津计划中的的人脸识别、语音识别和计算机视觉的一系列API已经被应用在微软小娜分析套件里。

如今，牛津计划中的语言理解智能服务（LUIS）的覆盖面进一步扩大，包括测试版的推出、支持中文和提供更多的预设模型。此外，牛津计划面部识别、可视化工具和语音识别SDK的测试版现在也可以通过GitHub获取。

支持中文！UIS的更多新功能

LUIS允许开发人员构建模型用于自己的应用中，从而理解针对该应用的指令和自然语言。

范例：LUIS对“move my meeting called budget review to be at 2 pm tomorrow”这句话的分析。LUIS同时确定了语句内（改变_日程_条目）的意图以及时间、日期和事件标题等实体对象。

先前，LUIS项目仅限受邀人员使用，而今LUIS测试版正式面向所有开发者公开。最新功能也同步上线，包括：

支持中文：提供中文支持是大家呼声最高的功能之一。现在，你可以随心所欲创建英文或中文LUIS应用了！此外，LUIS还能够正确处理夹杂英文片段的中文句子。

应用的导入和导出：现在，你向LUIS输入的所有应用数据都可以下载到JSON object中，并且能通过导入该JSON object来创建一个全新的应用。这样，开发人员就能够轻松复制应用、与他人共享应用以及对自己的应用进行代码管理——例如，让使用了LUIS的应用程序保持版本和代码的统一。

扩充预设模型：LUIS向公众开放的许多模型也在微软的产品中使用，目前可获取的模型数量从想法到实体已经不止扩大了三倍——从原来的56个到现在多达196个。

自推出以来，我们一直通过MSDN论坛与早期开发人员进行密切合作，我们还增加了未标记语句的批量导入，常规表示法机器学习功能、超高密集度的日期时间实体和大量的界面润色。

LUIS的标记界面可以很容易地对英语或中文语句贴标签，并迅速构建定制模型。

开发人员已经开发了许多非常神奇的LUIS应用！例如，Meekan公司为多个平台（Slack、HipChat等）开发的文本机器人可以帮助忙碌的人进行更充分的日程安排。这种机器人的独特之处在于它能够识别复杂的时间跨度和行动（例如“把会议安排在周三中午前后”，或“把明天的会议延后到周五下午”）。Meekan在所有意向和标签识别功能中使用了LUIS，以帮助区分公司的文本机器人可以或不可以帮助执行的行动，同时从用户的表述中发现重要的实体对象。

“从原型到生产准备的过程中，LUIS为我们节省了大量时间，”Meekan.com的联合创始人兼首席技术官Eyal Yavor说：“我们专注于用户交互，而LUIS则在后台工作，帮助我们了解用户的使用情况。刚开始我们仅用少量样本语句，LUIS的反馈回路就能帮助我们迅速改善机器人。”

微软GigJam项目还利用LUIS进行语言理解。目前尚处于预览阶段的GigJam提供了前所未有的新途径，打破设备、应用和人与人之间的隔阂，帮助团队完成任务，并转变业务流程。GigJam的用户只需要说“显示我的邮件”“把这些邮件排序”或（在屏幕上圈定了一张发票后）“和约翰AA”，这些五花八门、脱口而出的表达都将由LUIS来处理。

开发人员也曾告诉我们，他们使用LUIS构建了用于订购比萨饼、控制家里的设备、预约出租车和播放音乐的对话系统。通过将LUIS与其他牛津计划服务配对使用，开发人员还创造出了一些非常令人惊喜的东西，共有超过4000种模型，并且这个数字仍在不断增长。例如，开发人员借助牛津计划的语音API，设计了一个为人们说绕口令的技能打分的系统。通过与牛津计划中针对光学字符识别的视觉API配对使用，LUIS甚至可以识别meme图中的文字。

牛津计划SDK现已登陆GitHub

自从牛津计划推出以来，微软开发人员使用API创建了How-Old.net和TwinsOrNot.net（微软我们）等众多受欢迎的网站。今天，我们将牛津计划中的脸部识别、计算机视觉和语音识别SDK加入GitHub，力图帮助开发人员更容易地创建属于自己的应用。

通过专门用于客户端SDK的牛津计划软件库，开发人员能够查看源代码、访问历史记录、提交问题甚至为代码编写做出贡献。

由此，我们得以更好地与开发者群体携手，打造一个更具包容性、更强大的平台。目前软件库提供对Windows和Android两大平台在面部识别、计算机视觉和语音识别支持，我们正在努力增加其他的软件包，并增加呼声很高的、在iOS和Node.js两个领域的SDK支持。请访问https://github.com/Microsoft/ProjectOxford-ClientSDK，关注微软牛津计划，并进行分享和创造，同时也欢迎大家的意见、问题和引入请求。GitHub也不是唯一能找到牛津计划的地方——如需改善工作流程，您还可以分别通过NuGet和Maven获取我们的Windows和Android软件包。

现在就访问http://www.projectoxford.ai/sdk或GitHub（https://github.com/Microsoft/ProjectOxford-ClientSDK），试用牛津计划的SDK吧。期待大家创造的更多精彩。

相关阅读：

【开源】分布式机器学习工具包

【魔力胡须】教你在光棍节找到另♀一半♂~（男女通用！）

微软小冰住进微软研究院微信啦！快去和她聊聊天吧。

抗洪靠嘴，堵漏靠沙？印度官员真是绝了！

这样的洞庭湖决堤，实在让人同情不起来

有的人走了，却永远活着

圈内疯传某谣言

不要放过这些人渣