设为首页收藏本站language→→ 语言切换

鸿鹄论坛

 找回密码
 论坛注册

QQ登录

先注册再绑定QQ

查看: 649|回复: 1
收起左侧

像我这种零基础不懂编程的,能来学AI吗?

[复制链接]
发表于 2018-7-11 12:42:38 | 显示全部楼层 |阅读模式
本帖最后由 yeslab官方 于 2018-7-11 12:51 编辑

在6月28号的公会活动中

曹老师收集到了很多同学关于AI的提问

并且按照大家提问次数的多少进行了简单的排序。



                               
登录/注册后可看大图


根据曹老师的统计,公会朋友们最想知道的问题是


“如果自己没有编程基础,学AI技术会不会很难”


考虑到提Q1这个问题的朋友最多


所以下面我先来解答一下Q2:


“机器学习和自动化有区别吗?”。



                               
登录/注册后可看大图


别打人啊,是这样的:


第一个问题的答案特别现成,没有什么可展开的:


每一个已经报名了公会的朋友,


我们后面都会有相应的课程带领大家熟悉AI相关的编程知识,


所以加入公会活动的朋友们都不用担心编程基础的问题。


那……我能开始说说自动化学习和机器学习的区别了吗?


自动化强调的是由技术人员通过设置程序,让被控方自动完成某项固定的操作。所以,自动化一般用来处理定值的过程。说得再简单一些,自动化技术往往是用来执行一些机械性重复的、严重缺少或者基本没有创造力的工作。比如说,嗯,你懂的……



                               
登录/注册后可看大图


那么机器学习呢?(本文重点划一下)机器学习的重点是,在机器不断通过输入获得输出的过程中,对反馈的结果进行修正,让机器可以越来越接近地模拟人类的逻辑提供更加准确的反馈。通过输入获得输出,并且修正反馈的过程,就是我们经常说的训练了。


所以,人工智能和自动化的一大区别在于,人工智能反馈的内容并不是机械性重复技术人员输入的模式,而是按照训练后的模式不断输出创新的内容。



                               
登录/注册后可看大图


人工智能比较早的应用之一是机器翻译。在上一期的“YESLAB AI产品总监寄语”中,我们曾经提到过:早期的机器翻译采用的是通过语法逻辑实现翻译的方法。这种方式的限制我们上次已经通过“干爆鸭子”这道菜名的翻译给大家解释过了(按照AI的预测押球,靠谱吗?),下面换一种更好懂的方式帮助大家加深一下理解。



                               
登录/注册后可看大图


于是,到了21世纪,基于统计的方法已经彻底战胜了通过语法逻辑来实现的方法,成为了如今机器翻译实现的不二选择。其实,这就是机器学习的特点,机器学习特别适合处理概率性过程。


读到这里很多朋友可能会问,概率统计和语言文字处理有什么关系呢?凭什么概率统计可以实现语言处理呢?


为了解释概率论用于语言处理这一点,我来用处理中文举个简单的例子。



                               
登录/注册后可看大图


读过中学语文的同学都知道,中文的断句是个学问。所谓“句读之不知”,就是说人们在阅读的时候不懂得断句。


一句话在哪里断句、要不要断句、断成几句,这些都会影响大家对这句话语气甚至语义的理解。没错吧……


所以咯,如果无法正确地断句,那么机器对这句中文的理解都有问题,更谈不上翻译了。综上所述,要把中文翻译成其他文字,前提条件就是能够对中文进行断句。那么,机器怎么才能对中文进行断句呢?


                               
登录/注册后可看大图

(如果被删,那一定是断句断错了。。。)

首先,机器逐字地用一个保存有大量中文的语料库去匹配要断句的那句话,然后按照语料库中能查到的语料把句子断开。在很多情况下,一句话在按照上述过程进行断句之后,会出现不止一种断句方法,这就到了概率论出场的时候了。


这会儿,机器会按照各个断句方法,计算出每句话中各个前一个/几个词出现在后一个词之前的条件概率,然后再将这种断句方式中各个条件概率相乘。最终,概率最高的那种断句方法胜出。


虽然上面这个解释过程已经经过了大幅度简化,但我相信对于数学基础有限的同学,上面的流程说起来仍然有些抽象,我们来搞形象一些。请看下面这句标语:



                               
登录/注册后可看大图


嗯,假设机器在查询它的语料库之后,得到了下面两种断句方式:


1、严厉打击 / 多发 / 性侵 / 财 / 违法犯罪。


2、严厉打击 / 多发性 / 侵财 / 违法犯罪。


在这种情况下,通过计算概率,机器极有可能会选择第2种断句方式。因为“财”这个词出现在“性侵”这个词之后的条件概率太低了。毕竟,“性侵财”是什么鬼?到底劫财还是劫色?



                               
登录/注册后可看大图


在搞到这样一个断句系统和一个足够大的语料库之后,我们可以让机器通过概率统计的方式对大量中文进行断句,完成对这台机器的训练。


乍看之下,这种断句系统只有中文、日文等文字才用得上。但其实,除了中文断句之外,各个文字书写体的识别也引用了相同的模型。因为所有书写体都存在在哪里断开的问题。



                               
登录/注册后可看大图


相信通过前面的介绍,读者能够看出机器学习与自动化这两个概念的区别。考虑到这次还有篇幅,我再来简单地回答一下问题Q3:“推荐什么学习书?


如果大家不是特别着急的话,江老师在5月底就已经交稿了一本质量上乘的神经网络原理配套教材,这是YESLAB人工智能技术系列教材的卷1。顺利的话,这本书8、9月份就能出版上市了。人工智能技术系列教材的卷2目前正在编写中,这本书的内容承接卷1,但把着眼点放在人工智能项目的编程实现上。这套系列教材的后续则在研讨之中,目前列入考虑的是出版一本卷0来介绍人工智能的发展简史、出版卷3、卷4、卷5分别着眼于图像识别、自然语言处理和自动驾驶等不同领域的人工智能原理与实践。在后续作品方面,也欢迎大家给出建议啊。


另外,在提到人工智能学习书的时候,很多朋友都会问到《深度学习》这本书,想知道要不要买来读一读。


这本书确实是深度学习领域的一本有深度的、伟大的工具书。但它有一个小小的缺点,那就是它特别不适合初学者,而且也不适合作为一本自学类读物从头读到尾。


为什么呢?下面我通过一位某东卖家晒出的、这本书的一幅配图来说明这个问题。



                               
登录/注册后可看大图


有朋友又问了:难道卖家不是故意截取了书中公式密度比较高的一页照的吗?


这逻辑不对啊,卖家都是想把自己的货卖出去,为什么要刻意强调它不亲民的特点呢?所以,正确答案是,这是书中公式密度比较低的一页。


除了使用大量数学模型之外,这本书还需要读者本身已经对于机器学习的各类算法拥有了一定程度的理解。这么说吧,用这本书来启蒙人工智能,相当于用康熙字典当小学一年级的语文课教材……


所以,每次小产发现朋友圈里有人在一本正经地推荐这本书,都忍不住向他/她分享一下这个表情:


                               
登录/注册后可看大图

那么,这本书应该不应该购买呢?


小产认为还是应该买的。因为买这本书至少有三大好处。第一、它可以作为一本教辅在学习时进行对照;第二、它可以作为一本工具书在工作中进行参考;第三、它可以作为一本圣经放在家里镇宅和……装逼。


(THE END)



另外同学们对于学习AI还有什么问题


都可以给我们留言~


                               
登录/注册后可看大图

网址:www.yeslab.net


发表于 2018-7-12 14:59:12 | 显示全部楼层
我这小白是听完啦
沙发 2018-7-12 14:59:12 回复 收起回复
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 论坛注册

本版积分规则

QQ|Archiver|手机版|小黑屋|sitemap|鸿鹄论坛 ( 京ICP备14027439号 )  

GMT+8, 2024-3-29 05:52 , Processed in 0.068293 second(s), 9 queries , Redis On.  

  Powered by Discuz!

  © 2001-2024 HH010.COM

快速回复 返回顶部 返回列表