登录
原创

机器学习菜鸟的学习笔记(1)

专栏学渣的机器学习之路
发布于 2020-10-14 阅读 7340
  • Python
  • 机器学习
原创

1.一些关于机器学习的介绍

1.1 什么是机器学习?

此处提供机器学习的两种定义。

Arthur Samuel 将其描述为:“研究领域使计算机无需进行明确编程即可学习。” 这是一个较旧的非正式定义。

Tom Mitchell 提供了一个更现代的定义:“如果某计算机程序在T任务中的性能(由P衡量)随着经验E的提高而提高,则可以说它是从经验E中学习有关某类任务T和性能度量P的。”

例如:如何让电脑玩好快乐风男

E = 大量亚索玩家游戏的经验

T = 让电脑每场都使用这个英雄

P = 电脑使用亚索取胜的概率

通常,可以将任何机器学习问题分配给以下两个广泛的分类之一:
监督学习和无监督学习。

1.2 监督学习 (Supervised Learning)

在监督学习中,我们已经得到了一个数据集,明确知道该数据集的正确输出,同时认为输入和输出之间存在关系。监督学习问题分为回归(regression)和分类(classification)问题。

回归问题

预测连续输出中的结果,这意味着将输入变量映射到某个连续函数。如给定一个人的照片,我们必须根据给定的照片预测他们的年龄。

分类问题:
我们尝试预测离散输出的结果。 换句话说,我们尝试将输入变量映射为离散类别。如对于患有肿瘤的患者,我们必须预测肿瘤是恶性还是良性的。

1.3 无监督学习 (Unsupervised Learning)

无监督学习使我们几乎不了解结果应该是什么样子。 我们可以从数据中获得结构,而不必知道变量的影响。
可以通过基于数据中变量之间的关系对数据进行聚类来推导此结构。在无监督学习的情况下,没有基于预测结果的反馈。

聚类
收集1,000,000个不同基因的集合,然后找到一种方法,将这些基因自动分组为通过不同变量(例如寿命,位置,角色等)在某种程度上相似或相关的组。

非聚类
“鸡尾酒会算法”,可以在混乱的环境中找到结构。(即在鸡尾酒会上从一连串的声音中识别出个人的声音和音乐)。

评论区

Nexus_G
15粉丝

失学青年面临失业

4

1

0

举报