AI for Youth Academy 青少年AI研究计划

第一年 · 第04周

第四章:AI中的向量、三维空间和Python基础

本周我们将学到的数学与真实的AI应用联系起来。你将发现计算机如何将单词转化为向量,将坐标系扩展到三维,并开始使用Google Colab编写Python代码。

第1部分:为什么AI需要向量

这里有一个问题:计算机如何理解单词?计算机处理数字,而不是语言。所以AI研究人员想出了一个绝妙的主意——将单词转化为向量

这个过程叫做词嵌入。每个单词变成一个数字列表(一个向量),捕捉其含义。含义相似的单词在这个"向量空间"中最终靠得很近。

词类比作为向量数学

词向量最著名的例子是国王-女王类比

king - man + woman = queen

这意味着什么?当AI研究人员在数百万个句子上训练模型时,他们发现:

  • "king"的向量减去"man"的向量捕捉了"没有性别的王权"
  • 加上"woman"的向量给我们...最接近"queen"的向量!

这表明模型仅从阅读文本中就学会了性别和王室头衔之间的关系——没有人明确教它国王和女王是相关的!

另一个例子:动词时态

词向量也捕捉语法模式。考虑:

playing - play = studying - study

"play"和"playing"之间的差异("-ing"转换)几乎与"study"和"studying"之间的差异相同。模型学会了动词变位模式作为向量空间中的方向!

第2部分:踏入三维空间

到目前为止,我们使用x和y处理二维坐标系。但真实世界是三维的!要描述三维空间中的点,我们需要第三个轴:z

在三维坐标系中:

  • x轴:指向左(-)和右(+)
  • y轴:指向下(-)和上(+)
  • z轴:以45度角指向左下(-)和右上(+)

第3部分:Python基础

本周我们还开始使用Google Colab编写Python代码。Python是一种强大但易学的编程语言,广泛用于AI和机器学习。

变量和数据类型

在Python中,我们可以创建变量来存储数据:

temperature = 72        # 整数 (int)
price = 19.99           # 浮点数 (float)
name = "LEGO Robot"     # 字符串 (str)
is_active = True        # 布尔值 (bool)

列表

列表让我们存储多个值:

coordinates = [3, 5, 2]  # 三个数字的列表
print(coordinates[0])    # 打印 3(第一个元素)