第一年 · 第04周
第四章:AI中的向量、三维空间和Python基础
本周我们将学到的数学与真实的AI应用联系起来。你将发现计算机如何将单词转化为向量,将坐标系扩展到三维,并开始使用Google Colab编写Python代码。
第1部分:为什么AI需要向量
这里有一个问题:计算机如何理解单词?计算机处理数字,而不是语言。所以AI研究人员想出了一个绝妙的主意——将单词转化为向量!
这个过程叫做词嵌入。每个单词变成一个数字列表(一个向量),捕捉其含义。含义相似的单词在这个"向量空间"中最终靠得很近。
词类比作为向量数学
词向量最著名的例子是国王-女王类比:
king - man + woman = queen
这意味着什么?当AI研究人员在数百万个句子上训练模型时,他们发现:
- "king"的向量减去"man"的向量捕捉了"没有性别的王权"
- 加上"woman"的向量给我们...最接近"queen"的向量!
这表明模型仅从阅读文本中就学会了性别和王室头衔之间的关系——没有人明确教它国王和女王是相关的!
另一个例子:动词时态
词向量也捕捉语法模式。考虑:
playing - play = studying - study
"play"和"playing"之间的差异("-ing"转换)几乎与"study"和"studying"之间的差异相同。模型学会了动词变位模式作为向量空间中的方向!
第2部分:踏入三维空间
到目前为止,我们使用x和y处理二维坐标系。但真实世界是三维的!要描述三维空间中的点,我们需要第三个轴:z。
在三维坐标系中:
- x轴:指向左(-)和右(+)
- y轴:指向下(-)和上(+)
- z轴:以45度角指向左下(-)和右上(+)
第3部分:Python基础
本周我们还开始使用Google Colab编写Python代码。Python是一种强大但易学的编程语言,广泛用于AI和机器学习。
变量和数据类型
在Python中,我们可以创建变量来存储数据:
temperature = 72 # 整数 (int)
price = 19.99 # 浮点数 (float)
name = "LEGO Robot" # 字符串 (str)
is_active = True # 布尔值 (bool) 列表
列表让我们存储多个值:
coordinates = [3, 5, 2] # 三个数字的列表
print(coordinates[0]) # 打印 3(第一个元素)