大家好,欢迎来到IT知识分享网。
什么叫语义信息?
语义信息领域比较广泛,我们只关注计算机领域,也就是发现一串数据中蕴含的信息。
图像领域
- 视觉层即通常所理解的底层,即颜色、纹理和形状等等,这些特征都被称为底层特征语义;
- 对象层即中间层,通常包含了属性特征等,就是某一对象在某一时刻的状态;
- 概念层是高层,是图像表达出的最接近人类理解的东西。
通俗点说,比如一张图上有沙子,蓝天,海水等,视觉层是一块块的区分,对象层是沙子、蓝天和海水这些,概念层就是海滩,这是这张图表现出的语义。
自然语言处理
- 在统计学习时代,一般采用符号表示(Symbol-based Representation)方案,即每个词都看做互相独立的符号。例如,词袋模型(Bag-of-Words,BOW)是最常用的文本表示方案,忽略文本中词的出现顺序信息,广泛用于文本分类、信息检索等任务。N-Gram也是基于符号表示的语言模型,与BOW模型相比,将句子中词的出现顺序考虑了进来,曾在机器翻译、文本生成、信息检索等任务中广泛使用。
- 到深度学习时代,一般采用分布式表示(Distributed Representation或Embeddings)方案,每个语言单元(包括但不限于字、词、短语、句子、文档)都用一个低维稠密向量来表示它们的语义信息。分布式表示是深度学习和神经网络的关键技术。
语音
从自然语言理解概念的提出,到后续计算语言学(Computational Linguistics,CL)和自然语言处理(Natural Language Processing,NLP)相关术语的出现,伴随自动语音识别(Automatic Speech Recognition,ASR)和语音 合成(Text To Speech Synthesis,TTS)姊妹技术的同步发展,被统称为人类语言技术(Human Language Technology,HLT)的学科方向已经走过了近70年的曲折路程。近年来,从技术应用的角度来看,以机器翻译、人机对话系统、语音识别和语音合成等为代表的应用系统性能快速提升,在人类社会生产和生活中发挥了越来越大的作用。
免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://haidsoft.com/123046.html