小i机器人软件工程师揭秘机器人的“脑细胞”

NLP和NLU是两个概念,前者是自然语言处理,后者是自然语言理解,很多时候大家都会放在一起说:自然语言处理与理解,也有人会把自然语言处理和理解用NLP来统称,事实上这是两个概念,只是因为NLP的知名度和认知度比NLU更大,NLU很少被人提及。

人工智能的目标

在功能逻辑上,NLP是NLU的上一步,人和机器人通过文字、语音、图形、手势等自然沟通语言进行交互时,机器的大脑会首先对信息作出处理,然后再进行理解和反馈,它也是常见的“语义”,这部分工作就是由NLU技术来实现,它可以说是机器人的“脑细胞”,是认知智能领域关键技术中的核心。

-    推理
-    自动学习&调度
-    机器学习
-    自然语言处理
-    计算机视觉
-    机器人
-    通用智能

今天,带大家走进小i机器人的产品研发中心,认识一下来自NLU研发组的包包,让他给大家揭秘NLU技术的发展应用,以及他在小i机器人作为“资深软件工程师”是一种什么样的体验。

人工智能三大阶段

图片 1

 阶段 1——机器学习:智能系统使用一系列算法从经验中进行学习。

 阶段 2——机器智能:机器使用的一系列从经验中进行学习的高级算法,例如深度神经网络。人工智能目前处于此阶段。

 阶段 3——机器意识:不需要外部数据就能从经验中自学习。

Hello,包包,可以给大家介绍下产品研发中心以及你所在的NLU研发组吗?

图片 2

大家好,我是包包。 其实产品研发中心的主要任务是围绕着产品展开的,承担着调研、设计、计划、开发、测试、发布等一系列工作。

image.png

而我所在的NLU研发组主要负责产品以及引擎相关工作。我目前的工作内容主要围绕着base、pro、cluster、labs、International等产品以及对接能力研发,引擎相关开发优化以及解决项目中反馈的需求。

人工智能的类型

是什么契机让你进入人工智能行业的呢?在小i机器人工作的这几年,你的角色有了什么样的转变吗?

ANI(狭义人工智能):它包含基础的、角色型任务,比如由 Siri、Alexa 这样的聊天机器人、个人助手完成的任务。

AGI(通用人工智能):通用人工智能包含人类水平的任务,它涉及到机器的持续学习。

ASI(强人工智能):强人工智能指代比人类更聪明的机器。

我在来小i机器人之前一直做着互联网相关的工作。当初也是一个很偶然的机会,朋友向我推荐了小i机器人,然后随着小i机器人的步伐一步一步了解并进入人工智能行业。

什么使得系统智能化?

我是2014年加入小i机器人的,今年是第五年了。从刚进入公司对产品的一无所知到慢慢能够熟悉产品承担起产品的开发,期间也不断的遇到问题,也是很幸运有身边这些领导同事们给予我巨大的帮助,得以度过这困难的起步阶段。

图片 3

随着熟悉程度提高,逐渐由产品研发兼并引擎开发,也会接触到项目中反馈来的问题和需求,不断的与反馈人员交流沟通。在每一次的处理需求问题的同时,沟通能力、定位问题、解决问题的能力不断得到提升。所以我也非常庆幸我能够进入小i,更庆幸能够进入这么奈斯的部门团队。

image.png

那说说在产品研发中心工作是一种什么样的体验?

自然语言处理 | 知识表示 | 自动推理 | 机器学习

部门技术牛人多,都有自己擅长领域,在处理实际项目中反馈过来新的需求问题时,与部门领导同事交流下,前一秒还在抓耳挠腮的问题后一秒就引刃而解了。部门运动牛人也多,公司有健身房、乒乓球、桌球,下班空闲可以运动放松下。晚上有加班的时候,在忙完项目上的事情后,还可以去公司的深夜食堂补充能量~

什么是自然语言处理?


自然语言处理(NLP)是指机器理解并解释人类paralyzes写作、说话方式的能力。

NLP 的目标是让计算机/机器在理解语言上像人类一样智能。最终目标是弥补人类交流(自然语言)和计算机理解(机器语言)之间的差距。

图片 4

image.png

下面是三个不同等级的语言学分析:

  • 句法学:给定文本的哪部分是语法正确的。
  • 语义学:给定文本的含义是什么?
  • 语用学:文本的目的是什么?

NLP 处理语言的不同方面,例如:

  • 音韵学:指代语言中发音的系统化组织。
  • 词态学:研究单词构成以及相互之间的关系。

NLP 中理解语义分析的方法:

分布式:它利用机器学习和深度学习的大规模统计策略。

框架式:句法不同,但语义相同的句子在数据结构(帧)中被表示为程式化情景。

理论式:这种方法基于的思路是,句子指代的真正的词结合句子的部分内容可表达全部含义。

交互式(学习):它涉及到语用方法,在交互式学习环境中用户教计算机一步一步学习语言。

为什么需要 NLP ?

有了 NLP,有可能完成自动语音、自动文本编写这样的任务。

由于大型数据(文本)的存在,我们为什么不使用计算机的能力,不知疲倦地运行算法来完成这样的任务,花费的时间也更少。

这些任务包括 NLP 的其他应用,比如自动摘要(生成给定文本的总结)和机器翻译。

NLP流程

如果要用语音产生文本,需要完成ASR任务。

NLP 的机制涉及两个流程:

  • 自然语言理解
  • 自然语言生成

自然语言理解(NLU)

NLU 是要理解给定文本的含义。本内每个单词的特性与结构需要被理解。在理解结构上,NLU 要理解自然语言中的以下几个歧义性:

词法歧义性:单词有多重含义

句法歧义性:语句有多重解析树

语义歧义性:句子有多重含义

回指歧义性(Anaphoric Ambiguity):之前提到的短语或单词在后面句子中有不同的含义。

接下来,通过使用词汇和语法规则,理解每个单词的含义。
然而,有些词有类似的含义(同义词),有些词有多重含义(多义词)。

自然语言生成(NLG)

NLG 是从结构化数据中以可读地方式自动生成文本的过程。难以处理是自然语言生成的主要问题。

自然语言生成可被分为三个阶段:

  1. 文本规划:完成结构化数据中基础内容的规划。

  2. 语句规划:从结构化数据中组合语句,来表达信息流。

  3. 实现:产生语法通顺的语句来表达文本。

NLP 与文本挖掘(或文本分析)之间的不同

自然语言处理是理解给定文本的含义与结构的流程。

文本挖掘或文本分析是通过模式识别提起文本数据中隐藏的信息的流程。

自然语言处理被用来理解给定文本数据的含义(语义),而文本挖掘被用来理解给定文本数据的结构(句法)。

图片 5

image.png

例如,在 "I found my wallet near the bank "一句中,NLP 的任务是理解句尾「bank」一词指代的是银行还是河边。

大数据中的 NLP:The next Big Thing

如今所有数据中的 80% 都可被用到,大数据来自于大公司、企业所存储的信息。例如,职员信息、公司采购、销售记录、经济业务以及公司、社交媒体的历史记录等。

尽管人类使用的语言对计算机而言是模糊的、非结构化的,但有了 NLP 的帮助,我们可以解析这些大型的非结构化数据中的模式,从而更好地理解里面包含的信息。

NLP 可使用大数据解决商业中的难题,比如零售、医疗、金融领域中的业务。

本文由澳门太阳集团2018网站发布于科技中心,转载请注明出处:小i机器人软件工程师揭秘机器人的“脑细胞”