被AI “霸凌”失去连接词自由后,我找到了AI 写作最大的秘密
本文来自微信公众号:APPSO (ID:appsolution),作者:发现明日产品的,原文标题:《被 AI 「霸凌」失去连接词自由后,我找到了 AI 写作最大的秘密》
现在再讨论AI写作,多少有点没劲:prompt真的越来越像咒语了,越来越像一些神秘不可洞察的玄学技巧。
这导致使用AI写东西的过程,不管是写什么类型的文字,过程都跟做法似的:赌指令能不能触发出一些好的生成。同时还得用大量的指令,去掉「AI味」。
但问题是,我们在用的是一个语言模型,仅仅是纠结prompt要怎么写,无异于坐井观天——AI写作的「技巧」,其实都是大模型技术逻辑的投影。
终于,有一篇文章,不是在给出什么神之Prompt,而是列出了一些看似非常不起眼的技巧:重复、断句、语气词、准备草稿、使用破折号……
Shreya Shankar是加州大学伯克利分校电子工程与计算机科学系五年级博士生,在Google研究LLM数据处理系统的成本优化。
她以自己日常和大模型打交道的经验,写了一篇博客——看起来像写作建议,其实每一条背后,都藏着属于大语言模型的技术逻辑。
或许你已经看了很多教程、攻略,试图解决如何让AI生成更好的文本。但如果只看一篇关于AI写作的文章,那只能是这篇。
大模型的「坏毛病」真的坏吗?
模型是被互联网上的数据喂大的,只是,由于它是人工智能、是算法、是transformer变换器,它在吸收海量的数据方式,有机器专属的方式。最后反映到生成出来的文本上,就成了「人机味」。
但是「人机」并不意味它们毫无道理,也不意味着就是糟糕的文本。以下是几点比较典型的:
(1)排比和重复
重复可能是最有「人机味」的特征——或者叫排比,你会更容易理解。大模型生成的文本,总是喜欢用大段大段的排比,而且这些排比句是重复的。比如经典的「不是……而是……」
在一些短的文案中更明显,这种段落看上去花里胡哨,其实都是重复,导致信息密度很低。
像是工业酒精兑水做出来的酒,尝个两口就被恶心到了。
但是LLM经常有这种重复和排比,是由其运作机制决定的:吸收了海量数据的大模型,会不断地学习语言的「统计规律」。
排比是一个很常见的手法,重复显然也是。试着回想一下,小时候最喜欢写的那种作文,《我有一个梦想》《我的志愿》《我想对xxxx说……》,这些题目格外容易出产排比句。
这种规律客观存在,于是被模型学了去。同时,生成文本存在一种风险:越写越飞。
仅仅只是根据词语的频次,进行下一个词的预测,很容易陷入「只看眼前」的困境中,然后让句子的走向越来越远、越来越偏。
重复和排比有助于约束这种「放飞行为」,使得段落有一致性,整体结构更稳定。
【怎么办?】
重复和排比并不是洪水猛兽,Shreya也认为,有意的重复有助于阐明和强调内容本身。
同时,重复能够让整个文本变得更有预测性,对于读者的理解来说更友好。所以,有目的的重复是有价值的。
(2)指示型短语(signposting phrases)
指示型短语说的是类似于「“基本上”、“总之”、“关键是……”」这些词。在AI生成的英语文本里更常见,不过中文的学术写作、事务型写作里也不少。
这些词本身能起到整理逻辑的作用,但是放多了显得很僵硬。想想学术论文,读起来严丝合缝,这些连接词起了不小的作用。但是AI大行其道之后,人类仿佛失去了「连接词自由」。
都怪大模型太爱用。在生成过程中,模型不是靠发散思维和想象力,而是靠「预测+上下文对齐」。这些指示型短语就很有用了:它们就像「抓手」,指示模型马上要递进了、要划重点了、要举例子了,等等等等。
换句话说,这也是一种让文本整体更稳定,不跑偏的方式。只不过这些短语确实过于规整,用多了会枯燥无味。
【怎么办?】
连接词是有价值的。很简单,读者在看到这些指示型短语的时候能明确意识到,「哦,这里是结论」「接下来是举例」,整个阅读体验变得更明确。
所以一昧拿掉,只会是丢掉了一个很有用的武器。我们得自己检查生成出来的文本,做必要、适当的删减掉,这些删减掉的地方,如果有衔接问题,要用自己的脑子梳理一遍语句之间的结构,而不是强行靠复杂prompting再下指令。
(3)破折号
破折号是Shreya明确表示大语言模型的一个优点。确实,破折号的用处比想象的大:可以表示转折,或者强化语气,也可以用来做进一步解释,偶尔还可以代替括号——无论什么作用,它都能很丝滑地融入句子里,就像这样。
以及,破折号不像逗号、分号、句号等等有严格的句法规则,破折号更模糊、弹性大。对模型来说,这意味着「风险小」,容错高,还能增加表达味道。这意味着用破折号,不仅降低了生成难度,还能提升语气的丰富程度,可谓是简单又好用。
神奇的是,起码在中文写作里,破折号不是一个那么那么普遍的用法,它是一个更书面化的标点符号。在社交媒体、微信等日常交流里,出现得不多。
而目前的大语言模型,训练语料里以英文数据为多,这个标点符号也是赶上了水土不服——进入中文语境之后,很多用户看到破折号的瞬间,难免会和「机翻」联系在一起,产生割裂感,因为那不属于我们的写作语感。
【怎么办】
对模型来说,破折号的优点在于「丝滑」。它是一个非常明确的「提示符」,意在接下去的是补充内容,但是不需要用上连接词,也不需要写几个句子来解释。
严格来讲,这不是缺点,只是在中文语境中显得陌生。所以不必删掉每一个破折号,适当保留反而能够制造语气起伏,更有「人味儿」。
Sherya Hegde给出的最重要的技巧,恰恰和常见的攻略长得不一样:如果你想要好的文本,应该自己「写」,而不是围困于写出一个完美的prompt。
她自己的写作过程是这样的:「一旦我有了大纲,我会尽量自己写出每一段落,哪怕写得不够好。如果我知道自己想表达的内容,却无法把句子说出来(不幸的是,这种情况经常发生),我会写一个不成熟的版本,然后请语言模型帮我完善它。」
她没有把AI当成一个「代替自己思考的人」,而是当成一个文本助理,来处理那些自己表达不清、写不顺的地方。
这其实也是写作的本质:并不是让语言模型完成你想写的东西,而是用它,把你本来就想说的内容,表达得更清楚、更顺滑一些。
如果说真有什么「AI写作技巧」,也许不是藏在某个神prompt里,而是藏在你愿不愿意先下笔、敢不敢先写出那个「不成熟的版本」里。
欢迎加入APPSO AI社群,一起畅聊AI产品,获取#AI有用功,解锁更多AI新知
我们正在招募伙伴
简历投递邮箱hr@ifanr.com
✉️邮件标题「姓名+岗位名称」(请随简历附上项目/作品或相关链接)
相关推荐
被AI “霸凌”失去连接词自由后,我找到了AI 写作最大的秘密
看到大学生被AI检测折磨,我有话想说
谷爱凌夺冠!扒扒她的“神秘”生父:谷歌第五号员工
为什么AI替代不了写作?
AI写作,人类不能视而不见
00后创业潮:AI、风口与新世界
AI与创作者,找到了最佳共存方式
AI写作指南2.0:信息的输入比输出更重要
AI纪的引用法则
AI写作指南:智力的容器大于智力本身
网址: 被AI “霸凌”失去连接词自由后,我找到了AI 写作最大的秘密 http://www.xishuta.com/newsview138469.html
推荐科技快讯

- 1问界商标转让释放信号:赛力斯 95720
- 2报告:抖音海外版下载量突破1 25437
- 3人类唯一的出路:变成人工智能 24875
- 4人类唯一的出路: 变成人工智 24317
- 5移动办公如何高效?谷歌研究了 23996
- 6滴滴出行被投诉价格操纵,网约 11621
- 72023年起,银行存取款迎来 10723
- 8华为 nova14深度评测: 9997
- 9五一来了,大数据杀熟又想来, 9741
- 10“涉黄”擦边新闻不断,上门按 9341