我的github
posts - 3243,  comments - 42,  views - 158万

语言,人类独有的交流方式。而语言的形式——文字,人类最伟大的发明,携带着人类表达事物和自身情绪的信息。一句话,一篇文章,一部巨著,都是由文字构成。互联网上也是由大量的文字组成,每一个文字都包含着作者想传达的信息。

那么语言学和信息论是如何看待“语言”这一载体的呢?是不是文字越多,信息就越丰富呢?人类是如何习得语言这一技能呢?机器能不能掌握人类的语言技巧?如果机器会讲话,会写文章,写小说,那会是怎样的场景?于是,催生了计算机领域的自然语言处理这一门学科。微软小冰就是自然语言处理的产物,可以跟人对话。

对计算机来说,每一个字或者词语只是一串串不同的数字代码,但是它们却有着意义。人们讲话其实是有规律可循的。它们不仅仅是冰冷的词语,它们代指现实中的事物,或者人类虚构的事物。比如今天写一篇文章,要组织哪些词语,要写一部小说,需要哪些剧情,其实都是有规律可循的。要教计算机生成我们想要的文字结果,就需要训练计算机教给它怎么组建我们想要的文字。当喂食的这方面的信息越多,它就越熟练,越能生成我们想要的文章。(这点跟图像绘画生成很像)甚至可以自动编程打代码。

人类现在的信息是爆炸式的,一天贴吧或微博生成的网帖就有几亿的文字,因此自然语言处理就十分有必要。这对于捕捉网络信息的流向,网络舆论分析都有作用。让机器代替人来读文章,提取文章中的中心思想和关键词信息,会很快很高效。

posted on   XiaoNiuFeiTian  阅读(304)  评论(0编辑  收藏  举报
编辑推荐:
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理
· 理解Rust引用及其生命周期标识(上)
· 浏览器原生「磁吸」效果!Anchor Positioning 锚点定位神器解析
· 没有源码,如何修改代码逻辑?
阅读排行:
· 分享4款.NET开源、免费、实用的商城系统
· 全程不用写代码,我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了
· 上周热点回顾(2.24-3.2)
< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

点击右上角即可分享
微信分享提示