#在与AI对话中保护自己的话语
众所周知,现在AI对话兴起,很多社交媒体的文本也是由AI生成。然而AI文本质量良莠不齐,很多一眼看出尸块拼接。除了垃圾营销号外,很多人常用的场景是润色邮件或论文Introduciton。
就我个人而言,我几乎不用AI辅助写作博客,只在最后偶尔让AI检查一下病句和错别字。
但是,AI味究竟是什么,以及从这个角度能看出语言本身有什么特征呢?
##AI味
首先列出一些所谓的AI味特征,有我的感受也有别人的总结:
- 分段,分要点
- 开始陈述某一坨时在开头加一些声明:接下来一句话总结/最佳实践
- 接住
- 谄媚:你已经抓住了问题的核心
- 不是xx,而是xx
- 沉迷清奇的比喻,追求奇怪的辞藻华丽感
- 同义反复的内容很多。说了很多但似乎又没说什么,信息密度低(不会是为了多收费吧)
- emoji和markdown标记
这让我想起《时髦的空话》中提到的一些乐子,比如拉康的话:
我在写批注的时候脑中出现一些公式,如果你们允许我使用其中之———人的生命可以被定义为一个微积分,其中零是无理数(irrational number)。这公式只是个意象,一个数学隐喻。当我说“无理”时,指的不是某种无法探测的情绪,而是确实称作虚数(imaginary number)的东西。负一的平方根不符合隶属于我们直觉的任何东西,任何 real 的东西——就该名词的数学意义而言。然而,它必须和其充分的函数一起被保留。
太逆天了,甚至都不是正确的废话。
##标准的语言
除了对话,另一个常见场景是用AI润色,尤其一些行政类文本,每周工作总结等。
比如我写投稿论文的邮件就很依赖AI帮忙写开头结尾的礼貌用语。一方面是因为英语太差了,另一方面不知道西方文化里要说什么。比如 Thank referee’s comment. Hope this email finds you well. Please let us know if further modification is needed.
其实中文环境下我也不懂。比如参加学术会议,组织者收集基本信息,我也不知道开头结尾怎么说。这类人情世故感觉AI确实懂点。而且这种很套路,这种文本AI似乎很难有额外莫名其妙的AI味。
然而,为什么我们会认为(这些)文本从一种形式到另一种是润色,这里标准是什么?
更多华丽的词汇,或者有特定的常用词汇? 比如 Thank you for your email. We sinscerely appreciate your comments and suggestions. We have carefully considered your feedback and made the necessary revisions to our manuscript. We believe that these changes have significantly improved the quality of our work. Please find the revised manuscript attached for your review. We look forward to hearing your thoughts on the updated version.
但在这个过程中表示礼貌的用词是否有通胀/语义衰减的危险?这个现象似乎在AI之前就很明显,比如 I’m fine 意思是我不好,想说我很好的话要说 It’s great. 中文语境里比如哈哈和哈哈哈哈哈甚至笑死(笑死,根本没死)。
AI时代出现的另一个现象是文本长度的膨胀。各类内容越来越长,但我的感觉是信息密度越来越低。
除了礼貌用语,另一个也许争议少一些的润色的标准是病句检查。 写英文论文时,会用AI来检查病句。那么非病句是一种标准化过程吗?
不妨先考虑一下什么是病句:产生歧义是病句吗?非歧义的句子都不是病句吗? 或者内容矛盾的句子是病句吗?这有一点像程序bug的情形:有直接编译不通过的,有能跑但死循环的,或者有逻辑错误产生非预期结果的。
某种意义上,后两种都不是bug而是feature(本程序依赖此bug运行.jpg)。比如我的世界里不会下落的树木、苦力怕,dota中拉野的操作等,都是设计者预料之外的效果。类似的,在文学上,某些病句或自相矛盾的句子反而产生特殊效果,这是标准化非病句无法做到的,就像二阶逻辑语言有一阶逻辑做不到的:其形式本身拒绝了其内容。
比如鲁迅的《从百草园到三味书屋》里有 似乎确凿只有一些野草 这样的句子,或者 大约孔乙己的确死了,印象深刻当时有阅读理解题要求分析是否是病句;答曰不是,看似矛盾但表达了作者的思乡之情。陀思妥耶夫斯基的《地下室手记》还有连续的地下室万岁和让地下室见鬼去吧的句子;更大尺度上经常在作品中引入不可靠的叙述者,老卡拉马佐夫似乎确凿是私生子动手的。
这些不标准的语言,鲁迅与陀思妥耶夫斯基这样伟大的作者,我想不是让AI润色能润出来的(当然可以用prompt让AI模仿特定风格,但这里讨论的是所谓标准化语言,应当考虑默认语言风格)。
##文风
标准化语言的可能性暂且悬置,文本的文风是另外的问题。
文风是什么?比如语序、形容词顺序或选取、各类句式如倒装、更抽象的比如句子节奏等,可能都是文风的体现。比如海明威的语言,干净利落,词汇简单;陀思妥耶夫斯基的长篇大论、絮絮叨叨,您哪个不停;卡夫卡则充斥一种冷漠感。
值得一提的是,不堆积辞藻而用干净粗粝的语言去表达,这是十分困难的,需要舍弃大量累赘而取出最精确的表达,这样的语言很有威力。而这样的表达方式,也恰恰是AI那种长篇累牍式回答所欠缺的。
另一方面,很多人文笔不如AI,比如我,从小作文就不行,搞不来好词好句。能写通畅句子本身,已经越来越难了;或者更正确的说法是,写长文本的能力自古以来都是困难的,现在越来越少人能够或需要做到了。
语言能力是一种思考能力;把想法整理成文字就是一种思考方式,而且是很重要的思考方式。
If you’re thinking without writing, you only think you’re thinking.
Leslie Lamport
顺便一提,写博客很难,至少对我来说很难。我喜欢涉及一些争议性内容,做一些思辨。我是很欢迎思想上的讨论乃至辩论的,这对我来说是扩展视野、增进思考的方式。不过要整理顺畅完整的文本发到评论区,这就是一份难事了。欢迎挑战。
如果缺乏批判能力无法形成自身观点而单纯反对我的观点,或者甚至想要人身攻击,则实属无趣。
##翻译
最后一个切入点是翻译。
一些字词带有很细微的含义,概念的命名,要放在整个语言体系中考察,其词汇在语句中与其他词汇的关系,体现出一种整体表达效果。
比如人格障碍常用 disorder,比如 bipolar disorder,这就默认有一个order的状态。但在中文中通常翻译为障碍,例如双向人格障碍,含义上有微妙差异。
再比如 regular, normal 可以翻译为通常和正常、规范,但在数学中一般译作正则、正规(正则往往比正规的要求更强)。
语言体系也许会影响思考方式,多语言掌握者切换不同语言时思维方式也可能变化。 而用福柯风格的角度来看,语言是行使权力的方式,表示某概念的名词带着整个语言体系构成一种网状的束缚或规训。
AI当然可以按字面意思将文本从一种语言翻译成另一种;当使用AI总结长文本,或根据短prompt生成长文本,也构成另一种含义下的翻译方式。 在这个意义下,如今泛滥的AI文本有可能重塑一种语言模式,并将一切文化翻译至此,最终失去那些文化的独特性、留下唯一一种思维方式。 与《1984》的新话不同的是,这也许将是一种繁复的语言;相同的是,可能都无法表达太多思想。
##何去何从
AI的文风正在对人类写作产生影响。一方面人类长期对话浸淫于AI文本,会影响我们的语言风格。
反过来,AI是从人类文本中学习的,很多人确实有所谓AI味的文字习惯,结果被他人质疑(就像原创画师被质疑一样,但是作者很难直播写文章)。
可以想到的办法,修改AI、不用AI,或者进行日常用语或写作的脱AI练习(比如本文)。 但是这能需要解决的问题吗?毕竟现实环境是,在社会/社交媒体上暴露于他人的言语中,个人的努力很可能无法抵抗整体的变迁。
当然还有一种,放弃抵抗:后AI时代有其对应的社会形态。
##实验
最后搞点实验。用草稿作为输入,让AI生成并润色完整博文(不要说我的promot过于简单,要的就是这个原生效果)。