CtrlK

2-对ChatGPT的常见误解

ChatGPT

ChatGPT的作用

误解罐头回应

例如，认为当我们让ChatGPT讲笑话时，ChatGPT会从开发者准备好的一堆“笑话罐头”里找一个笑话来回答。

反驳全新笑话

当给ChatGPT这样的要求： `请说一个跟人工智慧有关的笑话，其中要包含一般人对于人工智慧的误解，这个笑话是要在机器学习这门课开学的第一堂课讲的` 会生成一些人很难理解的笑话。可见，ChatGPT 并不是从已经准备好的“罐头”中来搜索答案的。

误解网络搜索

认为ChatGPT是先从网络搜索相关的内容，然后整理搜索结果后形成回答。也就是说，认为 ChatGPT 是从网络上抄句子。

反驳与搜索不同

可以将自己的搜索结果和 ChatGPT 生成的回答进行比较，可以发现多数 ChatGPT 的答案在网络上都找不到一模一样的句子，甚至有很多幻想出来的答案。

函式

ChatGPT 就是一个函式(function)

输入：一个句子输出：这个句子后面应该接的词汇的几率

例如，

次次不同

解释了为什么ChatGPT 每次生成的回答都不同，因为每次采样的时候是有随机性的

问题如何生句

可是这样只能产生一个字，如何生成一个句子呢？

文字接龙

将生成的文字加在原先的输入后，形成新的输入。例如，生成“机”字后，加在原先的输入后，输入变成`什么是机器学习？机`，然后继续生成新的词汇。这样不断生成至一个代表结束的符号，则不再生成新的词汇，这样生成一个完整的回答了。

问题过去对话

那ChatGPT是怎么“记住”前面的对话呢。

包括历史对话

因为输入不只是当前用户的输入，还包括历史对话。比方说：

此时，输入不仅是 `c`，还包括了`a`和`b`。

非常复杂

这样一个强大的 function 非常的复杂，可能有 1700 亿个以上的参数。

参数

对于 $f(x)=ax+b$ 来说，仅有两个参数（a 和 b）

问题如何训练

如何训练出这样的函式呢？

人类+网络

需要人类老师教导+大量网络资料。注意，应该将“训练(Training)”和“测试(Testing)”区分开来，“测试(Testing)”并不需要联网。

备战和考试

“训练”就好比“备战”，可以读书上网。“测试”就好比“考试”，在考场上不允许学生翻书和上网。

2-对ChatGPT的常见误解

创建于：2024-02-19

随记

讨论

媒体