当AI遇上审查──中国特色「人工智能」的额外成本

在中国发展AI,需要承担因审查制度而产生的额外成本,分析家认为,这也使得大企业更可能独占AI的发展。其中一个因应方式是从训练资料下手,但这并非万全之策。

撰文|谢达文

来源:MotionElement

「我们不只要教AI什麽能说,还要教AI什麽不能说」──中国科技业圈内流传着这麽一句话,道尽在政治审查制度下,科技业者所面对的困难(Yuan, 2023)。

审查带来额外成本

对科技公司来说,额外的教学,等於带来额外的成本。尤其,人工智慧、大型语言模型的特色之一,就是连工程师自己都很难预测模型产出的结果,这也使得教学更为困难,成本也因此更高。

ChatYuan的故事,见证审查制度下公司所面对的难处。ChatYuan是ChatGPT问世之後,中国第一个功能相仿的对话式AI,在通讯软体微信上运作,背後的公司正是一家创新的小公司,位於杭州的「元语智能」。公司创办人徐良向媒体直言不讳,在中国做这一行并不容易,「需要更多层的过滤和处理」(Feng, 2023)。殊不知,他们所采取的过滤仍然不够,面世不过数周,就疑似因为对於政治问题的回答不合乎当局的要求,而一度遭遇禁言的命运(Yang, 2023)。

由於在中国发展人工智慧,需要面对这样的成本与不确定性,许多圈内人因此预测,中国的人工智慧市场,将由大公司独占──毕竟,对於小公司而言,要负担面对审查的成本,可能会太过沉重。

大企业独占的未来?

在中国,这也意味着百度、阿里巴巴、腾讯和小米等大企业,是最有可能在AI领域有所突破的公司,而这这些大企业也是中国政府近年来加强控制的公司。

中国政府控制大企业,依靠的不只是罚款等强制手段。2015年以来,中国政府开始购买这些公司的「黄金股」──虽然在帐面上,政府股权只占1%,相关单位却依法拥有指派董事、否决关键决策等权限。比如今年一月初,中国政府的「国家互联网信息办公室」,就买入阿里巴巴两间子公司以及腾讯的黄金股,并指派办公室官员担任董事。这样的状况不限於上面列举的四大公司,其他重要的科技业者,比如应用程式「抖音」的母公司字节跳动,中国官方也持有黄金股。这样的状况,也意味着,中国政府有更大的力量,可以从源头管制AI等科技的发展(McMorrow, Liu, and Leng 2023)。

但这样的发展,对於中国而言也是有代价的──中国的企业家和投资人担心,如果只有大公司能负担创新的成本,等於将中小企业、新创企业排除在AI革新之外,中国在人工智慧方面的创新会因此受阻;这也意味着,在中美竞争的格局下,中国不但不能急起直追,跟美国之间的差距甚至可能愈来愈大。

从训练资料下手

要能够避免AI「失言」,一个关键就在於从训练资料下手,毕竟机器人会怎样「学到」字汇之间的连结,取决於训练资料当中的文字内容。而既然中国网际网路上的内容已经经过审查,相对於使用全球的资料,只运用中国的资料来训练AI,对中国公司而言,将会更为安全。

而也确实,研究者也指出,同样是以中文资料训练的自然语言演算法,使用的资料是受到中国审查的《百度百科》,还是未经审查的中文《维基百科》,结果会大不相同(Yang and Roberts, 2021)。举例而言,运用《百度百科》训练的演算法,会将「民主」与「混乱」等负面词汇做连结,而「中国共产党」想当然耳会被正面评价。

不过,AI工具的「智慧」高低,取决於训练资料的广度和深度;训练资料受限,也意味着工具的能力受限,这等於是中国发展AI的另一重瓶颈。更何况,即使只使用中国的资料,仍然可能产出意料之外的内容,因此,科技公司仍必须采用其他的方式,过滤、审查AI的产出,相关的成本仍然无法避免。

当然,成本并非一切,尤其在国家引导钜额投资下,中国AI科技发展的潜能仍然不容小觑。不过,政治审查导致中国发展AI成本较高确是事实,在此之外,美国又在AI发展中抢得头筹,许多演算法上的创新,又是美国公司的商业机密,美国政府更限制中国公司取得高阶晶片等关键材料,这些都将使得中国AI发展的前景,充满不利的因素,值得持续注意。

参考资料(依文中出现顺序):

  1. Yuan, Li. 2023. “Why China Didn’t Invent ChatGPT.” New York Times, from https://www.nytimes.com/2023/02/17/business/china-chatgpt-microsoft-openai.html
  2. Feng, Coco. 2023. “Chinese Tech Firms Take Heed of Country’s Strict Online Moderation As They Rush to Bring Their Chatgpt-Like Services to Market.” South China Morning Post, from
    https://www.scmp.com/tech/policy/article/3209795/chinese-tech-firms-take-heed-countrys-strict-online-moderation-they-rush-bring-their-chatgpt
  3. Yang, Fan. 2023. “AI Chatbots with Chinese Characteristics: Why Baidu’s Chatgpt Rival May Never Measure Up.” The Conversation, from
    https://theconversation.com/ai-chatbots-with-chinese-characteristics-why-baidus-chatgpt-rival-may-never-measure-up-202109
  4. McMorrow, Ryan, Qianer Liu, and Cheng Leng. 2023. “China Moves to Take ‘Golden Shares’ in Alibaba and Tencent Units.” Financial Times, from
    https://www.ft.com/content/65e60815-c5a0-4c4a-bcec-4af0f76462de
  5. Yang, Eddie and Margaret E. Roberts. 2021. “Censorship of Online Encyclopedias: Implications for NLP Models.” Proceedings of the 2021 ACM Conference on Fairness, Accountability, and Transparency, pp. 537-548.
科技玩家阿綠