数据
文字、图片、声音、表格、代码都可以成为数据。它们像 AI 的练习材料。
第 4 课
AI 不像你一样坐在教室里听讲、练习、提问。它通常是看大量样本,像做很多很多道练习题一样,慢慢调整自己的“小开关”,让自己的预测越来越接近正确答案。
文字、图片、声音、表格、代码都可以成为数据。它们像 AI 的练习材料。
标签像答案纸,告诉 AI 例子的答案是什么,比如“这张图是猫”。
训练像反复订正错题。AI 根据错误不断调整,下一次争取更接近答案。
评估像小测验。用没见过的新例子测试,看看它是不是真的学会了。
如果训练例子不够多、不够真实,或者某一类例子特别多,AI 就可能形成偏差。偏差就像只在一个操场练球,到了另一个场地就不习惯。比如只给它看白天的狗照片,它看到夜晚的狗可能就不确定;只给它看一种写法,它可能以为其他写法都是错的。
只看几道题就考试,很容易误会规律。
某一类例子太多,AI 可能总往那一类猜。
遇到训练里少见的新情况,会猜得不稳。
世界在变化,模型不知道训练之后发生的新事,除非它能搜索或更新。
它为了完成回答,可能生成听起来合理但不真实的信息。