— 行业资讯 —
点击数:153 时间:2024-11-12
中英互译、离线互译、反对Wifi和SIM卡相连,价格高达2799元,随后2017年9月,科大讯飞发售“译为呗”,无屏、不反对离线翻译成,价格减少为1399元。2018年4月,科大讯飞发售晓译翻译机2.0,带上触屏、摄像头、反对20种语言在线互译,中英离线翻译成,价格为2999元。2017年9月,分音塔科技发售准儿翻译机,反对31种语言互译,不反对离线翻译成,售价1288元;2017年10月,网易明确提出有道翻译成蛋,带上触屏、反对27种语言在线翻译,不反对离线翻译成,价格638元;2017年12月,百度公布途鸽翻译机,无屏、反对4种语言互译,定价2399元;2018年3月,搜狗发售旅行翻译成宝,带上触屏、摄像头;反对24种语言在线翻译,中英离线互译,售价1498元;2018年5月,小米生态链企业香蕉上下班明确提出魔芋AI翻译机,无屏、反对14种语言、不反对离线翻译成,售价249元。
可见,翻译机的功能和形态还正处于探寻阶段,若无屏幕、带不带摄像头、反对多少种语言、能否离线翻译成都能影响其价格。其中,离线翻译成对于硬件设备的拒绝很高,对成本的影响大。我们告诉,在线翻译可以用于云端机器翻译,而离线翻译成能用于的机器学习就很受限,此前,在线翻译的效果相比之下高于离线翻译成。
想取得好的离线翻译成,大自然必须在硬件和软件上下更大的功夫。了解到,2018年6月13日,谷歌公布离线神经机器翻译技术(Neural Machine Translation),使得离线状态下 ,也能用AI翻译成,且反对59种语言。
据理解,神经机器翻译(NMT)是机器翻译的一种方法,它用于大型人工神经网络来预测单词序列的可能性,一般来说在单个统合模型中对整个句子展开建模。这一技术,也许将不会对翻译机导致一定的影响。
AI+教育2017到2018年,AI+教育沦为人工智能集体攻坚的传统领域。AI+教育不少的场景和产品都运用了NLP的技术,例如:中文分词、智能试卷、科学知识图谱等。以语音+语义技术为核心,融合云计算、大数据,科大讯飞在AI+教育上获得了不少成果,教育也沦为科大讯飞最重要的营收来源之一。据科大讯飞2018年上半年财报表明, 2018年上半年,教育板块的营收6.58亿元,同比快速增长16.35%。
科大讯飞在智慧教育领域,早已打造出了包括智慧考试、智慧校园、智慧课堂、智慧教学、智慧管理在内的一体化智慧教育产品体系,在全国31个省、自治区、直辖市及新加坡等海外市场广泛应用,与13000余所学校创建合作,服务师生多达8000万。其主要的场景有校园管理:建设校本资源库,建构优质资源动态改版、资源共享分享的生态圈,构建学校优质、特色教学资源的累积和分享;AIUI语义:构建语音辨识、语义解读涉及能力,融合后末端信源,必要通过语音调用涉及内容信息,超过天气预报、风险预警等信息及时主播;语义解读:通过语音处置,展开语义解读,理解用户意图,并通过云端知识库交互超过信息的及时表达;私有云更为自定义简化的信息保证答案更为精准有效地;汉语水平等级考试:系统基于国家普通话水平测试大纲,可精确的对试题命题说出之外的所有测试题型展开自动评测。
在智能试卷方面,2017年11月20日,新东方与科大讯飞牵头正式成立的合资公司“东方讯飞来”公布第一款基于AI的智能自学产品RealSkill,构建雅思、托福试题口语与文学创作的智能评分与测验。(公众号:)还注意到,除了英语之外,NLP技术在中文读者领域也早已能商业化。
2018年8月,中文少儿分级读者平台“考拉读者”宣告已完成2000万美金B轮融资。此次融资将主要用作考拉读者原创“中文分级读者系统ER Framework”的优化升级、优质读者内容的生产单体及市场规模的不断扩大。考拉读者的中文分级读者标准(ER Framework)糅合了国外的“词、句”的分析思想,基于ER Framework的分级读者标准在「词」、「句」的基础上再行重新加入「字」、「段」、「篇」三个维度,即从「字词句段篇」五大维度萃取几十个特征来传达中文的可玩性,并构建段落、主题等的分析。
如在「字」其下还有常用性、构形、人组性三个特征,「句」则有句法结构、语义逻辑、思辨传达和嵌套深度四个特征等等。文分级读者系统 ER Framework,将中文文本按照可玩性展开分析分级,并给定学生有所不同的读者能力,进而获取个性化的读者内容及语文自学解决方案。
AI创作机器可以做到很多理性的东西,那么它可以做到一些创造性的东西吗?虽然人类对创造性的拒绝很高,梵高的画作、贝多芬的交响曲、李白杜甫的诗词,这些在人类历史长河中闪闪发光的文化遗产是人类创造性的反映。即使是对人工智能抱着有将来希望的李开复,也毫无疑问AI需要不具备创造性。但是,微软公司却仍然在坚决AI创作的尝试,在近两年获得了不少成果。
微软公司小冰除了对话能力外,还不具备写诗、写出歌词、作曲、合唱等能力,这些都是NLP技术的伸延。曾报导,2018年5月,微软公司小冰宣告“合唱深度自学模型已完成第四次根本性升级,合唱水平相似人类,且开始向作词、作曲、合唱全面发展。
其与知乎合作的新曲“我闻我新的”就是由小冰作词特合唱。据介绍,第四次递归版本有三大改版:首先,重新加入换气声自动合成能力,歌声与气息融合,听得一起更加大自然更加有感染力。其次,第四次递归本在在深度自学建模中减少掌控的方式,字与字、音符与音符之间的过渡性更为连贯流畅。最后,通过更进一步优化的深度神经网络结构,以及大幅补足的训练数据,使小冰分段自学来自有所不同人类歌手的演唱风格,更进一步瓦解手工参数输出,自行已完成演译。
小冰作词与小冰创作诗歌完全相同的分解模型——基于LSTM的seq2seq模型,但是训练数据从诗歌替换成了歌词,小冰利用深度神经网络自学多达1000万行的歌词语料,并在此基础上训练,再行通过多感官所致创作启发,分解歌词。AI创作必须更加强劲的自然语言分解能力,目前大部分的对话式人工智能并不具备,很多问的语句还是提早输出的,或者是通过搜寻萃取的。微软公司的自然语言分解能力也早已带入到了对话式人工智能中,在公布”全双工语音交互感官“技术时,微软公司小冰就早已不具备”自然语言分解模型“,微软公司小冰的所有恢复都是自己分解的,大同小异传统的基于模块、搜寻来展开恢复。微软公司推崇AI创作,是期望AI能与人牵头建构。
AI转入内容生产领域,并不是要替代人类,而是沦为人类的助手,某种程度是在一般的领域,创作领域只不过也是可以做的。只不过每个人都有创作的性欲,只不过有些人有艺术的天分,沦为了画家、音乐人、作家,而有些人没这样的能力。AI就可以协助每个普通人,让他们都有创作一些个性化的内容的能力。虽然写诗和唱歌还没显著大规模商业化,但是另外小冰讲故事和小冰的文字概要能力却早已大规模落地。
小冰的儿童有声读物自动分解技术成果,已取得多达400万小时的收看量,小冰姐姐讲故事有声读物早已覆盖面积国内90%以上的儿童早教机器人和80%在线收看平台。微软公司小冰将机器人撰稿技术运用到金融领域,可以说道是寻找了一个更加刚刚须要的场景。王永东讲解,在过去的248天里,小冰高调地使用化名与万得资讯和华尔街见闻展开了合作,对金融领域中全部26个类别的公告展开攻坚和测试,通过金融文本分解概要,向金融机构、财经APP和个人投资者获取概要服务。
目前,小冰的文本分解技术早已覆盖面积国内大约90%金融机构、75%经批准后的合格境外投资机构和约40%的国内个人投资者。在金融信息服务领域,速度意味著金钱,与人类比起,人工智能在这一点上优势显著。
王永东讲解,微软公司小冰可以在企业公告公布的同时,用20数秒的时间分解高质量的概要。未来,小冰在金融领域不会还不会扩展产品线,获取更好的金融服务。
除了微软公司小冰之外,还曾报导过IBM不会辩论的机器人。2018年6月,IBM Research发售AI系统Project Debator,在旧金山IBM办公室,人工智能在一场辩论赛中打败了人类顶尖辩题,它的输掉是以色列国际辩论协会主席Dan Zafrir和2016年以色列国家辩论冠军Noa Ovadia。据IBM官方讲解,Project Debater是第一个可以在简单话题上与人类辩论的AI系统。
Project Debater通过处置大量文本,就特定主题建构出有有较好结构的演说,获取清晰明确的目的,并驳斥其输掉。最后,Project Debater将通过获取引人注目的,以证据为基础的论点并容许情感、种族主义或模棱两可的影响来协助人们推理小说。目前,Project Debater如何展开商业落地,还不得而知。
AI语音芯片火热智能音箱、智能家居等硬件产品的疯狂早已检验了智能语音交互与IoT融合的趋势,这个新的趋势也对芯片这样的底层硬件明确提出了全新的拒绝。此前,智能音箱中的AI推理小说和运算都是在云端已完成,反应的速度更为较慢,延后显著。云知声创始人/CEO 黄伟回应,“在 AIoT 市场加快愈演愈烈的今天,云端方案在网络、比特率、能耗、隐私以及边缘计算出来等方面的容许,使得面向物联网的 AI 芯片沦为必然选择。
”5月16日,云知声在北京公布了首款面向物联网领域的AI系列芯片UniOne以及第一代芯片“雨燕”;5月24日,外出问问在北京公布了旗下首款AI语音芯片模组问芯Mobvoi A1;6月26日,Rokid在杭州公布了旗下AI语音专用SoC芯片KAMINO18;刚好,思必驰CEO低兴宁证实公司正在打造出AI语音芯片,预计今年下半年流片;7月4日,深圳微纳感官计算技术有限公司(微纳感官)牵头杭州中天微系统有限公司(中天微系统)宣告将要在今年下半年公布智能语音芯片,杭州中天微系统不久前被阿里巴巴全资并购。这些AI语音芯片都有相近的目的,例如:为语音交互硬件获取横跨设备形态的 AI 感官能力和本地推理小说能力;深度自学网络架构,提高运算能力;减少数据比特率拒绝等。
只不过,AI语音芯片,NLP都是语音公司线脚发展的市场需求。近几年,以科大讯飞、云知声、思语音辨识的公司发展迅速,语音辨识的发展也造就了自然语言处置涉及的发展。然而现阶段,语音辨识、语音合成、智能设备终端、智能设备苏醒等问题都早已基本解决问题,再行过两三年也许就能彻底解决,“听到”的问题解决问题后,下一步大自然就是“听不懂”,在“听不懂”的方面,自然语言处置技术任重而道远。思必驰CEO低兴宁曾告诉他智东西,思必驰在创业之初,整个研究团队最先做到的就是语音辨识、人机对话,但2007年那个时间节点,移动互联网浪潮还没蓬勃发展,更加不要说道AI应用于了,没市场需求则“技术无用武之地”。
但随着物联网阶段来临,语音交互的市场需求开始愈演愈烈。“在技术创新上,思必驰核心不会环绕人机对话来进行”,低兴宁谈及,尽管现在思必驰的语音技术早已落地很多终端,效果也不俗,但是整个嵌入式体验还是过于的,还要下功夫提高用户体验。
巨头之下,创业机遇NLP技术比CV技术更加无以,目前完全都是大公司才有精力做到NLP技术的研发,在算力、数据、人才上都是创业公司无法比拟的。但是,由于NLP包括众多研究内容:中文自动分词、词性标示、句法分析、自然语言分解、文本分类、信息检索、对话系统、文字编辑、自动概要等。这些技术都在逐步地商业化,但是因为各个领域所使用的数据、技术都有相当大区别,并会有一个统一的技术经常出现,每个领域都还有创业公司存活的空间。
手机智慧诸法屏三角兽是一家典型的NLP创业公司,三角兽的三位创始人中,一位是度秘中控负责人王卓然,一位是微软公司小冰创始人之一亓超。自2016年三角兽正式成立起,公司就致力于基于自然语言处置技术,为各个领域打造出嵌入式解决方案。
三角兽目前早已已完成B轮1.1亿人民币融资,主要致力于四项技术能力:语义解读、对外开放域聊天、多轮对话、跨域中控,落地智能客服、智能手机方案和智能硬件三大方向。智能手机方案是三角兽更为独有的落地场景,据介绍,近期公布的OPPO R15和VIVO X21,以及今年一些品牌新机的“智慧诸法屏”功能,都由三角兽获取。该功能全线贯通系统层,覆盖面积还包括微信、微博、各种app和短信,对手机任何一段文字展开语义解析,并发售数个卡片满足用户,一步到位解决问题用户获取信息和服务的市场需求。
此前,三角兽还为罗永浩的锤子手机获取“Bigbang”功能,可以使大段文字——不管它们是以图像还是文字的方式不存在,不管它们是中文还是英文——都可以被切割成语义涉及的词或字,从而可以被更为便利地自由选择和编辑。多模态情感辨识竹间智能正式成立于2016年,创始人简仁贤曾是微软公司亚洲工程院最高级别的负责人之一,其参予和向其汇报的项目还包括了Bing亚洲地区的战略与合作伙伴关系,微软公司的虚拟世界助手小娜以及亚洲地区的商业所求业务。
竹间智能的核心业务是文本分析、大自然语义解读、情感计算出来。竹间智能主要有两条产品线,一条是类脑对话机器人,包括了客服机器人、导购机器人、金融机器人、营销机器人、个人助理、品牌IP机器人等;一条是多模态情感识别系统,还包括情绪辨识分析系统、人脸表情识别系统、印象分析系统、广告效果分析系统、呼叫中心质检系统、课堂情绪分析系统等。
对话机器人的应用于场景可以区分为C末端和B末端,C末端必要服务于客户,对用户体验拒绝十分低,这个领域最重要由巨头攻占。服务于B末端必须做到得更加横向,最少的是做客衣、导购机器人,必须为横向领域获取有所不同的解决方案。在这个领域我们也看见很多创业公司,例如:小i机器人、云回答机器人、智能一点、助理来也等。这个领域早已远比是蓝海,NLP公司必须谋求更好的差异化。
竹间智能的多模态情感识别系统做了差异化的竞争,其好比可以辨识文字情感、语音情感还加到了视觉情感,将三者融合一起做到多模态的情感辨识。在竹间智能CTO翁嘉颀显然,嵌入式分成三个层次,最底层是自然语言处置,第二层是意图解读,第三层是解读背后的涵义,目前业界还逗留在前两个阶段,要做第三个阶段,情感计算出来不可避免。
目前,竹间智能的多模态情感辨识也早已创新性地应用于在了新零售场景。企业科学知识传播思必驰是国内领先的语音技术厂商,专心智能终端领域,为智能车载、智能家居、智能玩具/机器人、智能穿戴、智能手机等打造出自然语言交互产品方案,目前早已终端上亿智能终端。今年7月思必弛宣告发售针对企业智能服务的自定义平台——不会话精灵(talkinggenie,http://ba.dui.ai),定位为企业科学知识传播,利用启发式对话技术和简单结构科学知识管理技术为大众企业获取更加简洁的科学知识和信息的交流方式。
初敏谈及,思必驰现在的主战场是智能设备、IoT,都是环绕着人的生活中的各种娱乐、上下班、会议,辅助人的日常生活。但是现阶段,智能语音设备的底层问题,如终端、苏醒、对话,都早已基本解决问题,未来两三年可能会彻底解决,那么智能语音设备厂家之间的差距就变大了。思必驰现在换回了一种思路来思维智能语音设备的发展,在她显然现在必须的是更加多的企业将自己的服务交付给智能语音设备,以后有可能会只有一个通用型的音箱,不会有很多专用场景,在有所不同的场景解决问题有所不同的问题。在对话式人工智能以及NLP领域,巨头享有着多年的技术累积、平台优势,微软公司、百度都在对外开放对话式人工智能平台和技能,在这种情况下,创业公司再行去做到平台或者底层技术并不现实,必须融合多种NLP技术,必须差异化的场景和更加横向的领域。
小结2018年,计算机视觉赛道早已渐趋安静,NLP赛道却十分繁华。NLP研究的内容领域众多,还包括:中文自动分词、词性标示、句法分析、自然语言分解、文本分类、信息检索、信息提取、文字编辑、解说系统、机器翻译、自动概要、文字蕴涵等等,每一个领域都很难懂,没一个标准化的技术能解决问题所有问题,其技术难度远大于计算机视觉。飨宴未来的NLP,我们不会想起:能畅聊的对话机器人、精准的动态翻译成、不会阅读写作的AI。
2018年,以上这些愿景都在一步步构建。仔细观察到,2018年,智能语音交互与IOT平台的融合、翻译机、AI教育、AI创作等领域是NLP技术的热门应用于场景,巨头和大公司都在扎堆布局。
同时,为了更加了解布局,不少巨头和语音公司都开始做到物联网/语音芯片。除此之外,NLP创业公司也在积极探索合适自己的横向领域,例如三角兽的智慧手机诸法屏方案、竹间智能的多模态情感辨识、思必驰的企业智慧服务。
本文来源:必赢亚洲-www.curelap.com