Introduction to Machine Learning

1.什么是机器学习?

        “机器学习”,就名字来看,这个技术似乎有意于让机器拥有学习的能力。学习的过程是怎样的呢?对于人类来说,学习的过程无非是:1.接受外界输入 2.信息的处理与整合 3.输出 的过程,在这样的过程中人们习得记忆和经验,以便于下次遇到类似的问题能够依赖获得的东西去解决。

        从这方面看机器学习确实和人类的学习方式有很多的相似之处。1.机器学习需要输入。机器学习的过程中我们需要为计算机准备数据集,通常称之为Train Set(训练集),这就类似我们人类接受的信息。 2.机器学习需要处理信息。机器学习在过程中会用特定的方式对训练集的数据进行处理,处理的过程正是经验获得的过程。 3.最后机器会依照获得的东西输出。

        以上是对“机器学习”感性的描述。

        “机器学习”的目标应该说是在训练一个模型,或者说,找一个“函数”(Function),一个能解决某一类问题的函数。 例如将语音转化成文字的函数,这种函数的参数非常多,我们无法通过人工直接找出,所以我们给机器一个函数集(Function Set) ,要求机器自己寻找到那个函数。我们会提供数据以便于计算机找到函数。机器学习被视为人工智能研究的一部分,其算法是基于样本数据来构建模型的,所以说机器学习的过程就是在利用样本数据提升模型相对某种任务的泛化性能。

        常见的机器学习的任务分为:Regression和Classification两种。但是还有一个structure learning的问题,这个问题教科书上往往提的不多,但其实很多任务都隶属于structure learning的范畴。

2.机器学习技术分类

        机器学习通常有以下几个步骤:准备训练数据、选取模型、使用数据训练模型、模型评估与调整。而根据模型训练的过程中接收到的监督数量与类型的区别,我们可以将机器学习分为以下几种:监督学习、半监督学习、无监督学习、迁移学习和强化学习

  • 监督学习(Supervised Learning)

        在监督学习的过程中,我们需要大量的训练数据(Training Data),而且这些训练数据需要经过”标注”处理。因为监督学习的过程中,我们的训练数据要告诉模型,我们要找的函数的Input和Output的关系,所以训练集中需要有Output,但是Output很难用自然办法获得,于是就需要”标注”处理。

        监督学习的好处是,通常训练起来会比较快,训练好的模型效果也会比较好;缺点就是数据集的获得很麻烦,需要大量人工的收集与标注。

  • 半监督学习(Semi-Supervised Learning)

        出于监督学习中数据集获取的困难程度的考量,人们提出了半监督学习的概念。

        半监督学习就是在有标注数据和无标注数据混合成的训练数据中对模型进行训练,一般假设,无标签数据比有标签数据多,甚至多得多。这就有效的减少了训练数据获取的难度。在半监督学习的技术中,这些没有标注的数据可能也对学习有帮助。

  • 无监督学习(Unsupervised Learning)

        无监督学习,顾名思义,所有训练数据都没有标注。训练过程中,要求根据样本间的相似性对样本集进行分类(聚类)试图使类内差距最小化,类间差距最大化。

  • 迁移学习(Transfer Learning)

        考虑到现实生活中大部分数据或任务是存在相关性的,所以人们提出迁移学习的概念。迁移学习就是运用在某个地方已经学到的知识通过某种方式分享给新模型,从而加快并优化新模型的学习效率。迁移学习的目的是找到已有知识和新知识之间的相似性,这样可以避免新模型从头开始训练,从而节省资源。(举一反三的意思???)

        当下,迁移学习的应用十分广泛,在自然语言处理的研究中,著名的Finutune-BERT模型就属于迁移学习的方式,人们利用已经预训练好的模型去拟合自己的数据集。

  • 强化学习(Reinforcement Learning)

        强化学习与监督学习、无监督学习等的最大不同之处在于,我们没有告诉机器正确的答案是什么,机器所拥有的只有一个分数,就是他做的好还是不好。我们通常会设置一个激励函数来告诉模型做的好不好。(激励函数的设置十分重要)

之前火了的“拒绝抓羊,选择一头撞死的狼”的AI就是强化学习中激励函数没设置好出现的问题。

这样的AI是真的吗?

        根据激励函数给的反馈,模型要自己去修正自己以寻求最优解,在这样的过程中训练的模型,会具备更高的“智力”。

(PS:一个强化学习的著名应用:AlphaGo(以监督学习和强化学习共同训练而成))

最后附上神图🙄(bushi..

参考资料

1.LeeML-Notes

2.什么是迁移学习 (Transfer Learning)?这个领域历史发展前景如何?

3.什么是无监督学习?

4.Machine learning——Wikipedia

5.什么是机器学习?

6.李宏毅《机器学习》(Video)