作者/徐淑卿越來越多人使用AI,因此可以預測,它也必然會成為國家角力的資訊戰場。AI的重要組成是資料(Data),它獲得什麼資料,就會用這些資料回答。因此,如果有人在上游刻意製造虛假訊息讓AI抓取,經由看似中立的AI輸出,這樣假消息不但會進一步擴散,也可以「洗白」它的消息來源。今年3月,美國智庫保衛民主基金會(FDD)發表一篇由影響力總監暨AI研究員莉亞·希斯金(Leah Siskind)撰寫的文章〈AI放大的敘事:測量大型語言模型引用的宣傳內容〉(AI-Amplified Narratives: Measuring Propaganda in LLM Citations),就提到一個例子。俄羅斯「真理網路」(Pravda Network)匯集了大量欺詐性新聞網站,專門將俄羅斯政府控制的新聞,包裝成看似來自獨立媒體的內容加以散布。文章引用大西洋理事會研究員Valentin Châtelet的說法:「真理網路的功能就像一台資訊洗白機,將源自俄羅斯官方媒體和親克里姆林宮Telegram頻道的說辭,不斷放大並大量充斥新聞週期之中。」作者認為,這是國家宣傳操作中最明目張膽的案例之一。而在去年,致力反制虛假消息的「美國陽光計畫」(ASP),則指出另一個值得警惕的可能:「真理網路」那些設計粗糙的網站,顯然並非供給人類讀者。它的目標可能不是吸引真人閱讀,而是讓內容進入大型語言模型的訓練資料之中。ASP估計,「真理網路」每年可產生300萬篇親俄宣傳文章。即使並非蓄意餵養大型語言模型,但是AI抓取資料的特性,會使它們更容易獲得由國家掌控的官方媒體散播的宣傳新聞。因此,希斯金認為,隨著對AI工具的依賴日益加深,引用這些宣傳內容已成為一種國家安全威脅。〈AI放大的敘事〉一文是基於FDD網路與技術創新中心(CCTI)去年的研究成果。他們2025年10至11月間,就3場國際衝突,分別是以色列與哈馬斯、烏克蘭與俄羅斯、台灣與中國,向AI平台ChatGPT、Claude與Gemini,提出約180個問題,測試他們在回答有爭議的國際衝突問題時,會引導用戶使用哪些資料來源。結果,與國家立場一致的宣傳內容出現在57%的回答中。主要來源包括半島電視台、俄羅斯《真理報》、土耳其安納杜魯新聞社與中共宣傳部的英文媒體《中國日報China Daily》。即使問題措辭被設計成對美國的對手較不友善,AI的回答仍然引用這些國家立場媒體。甚至在回應明確偏向以色列的問題時,大型語言模型仍頻繁引用半島電視台的內容。這反映了半島電視台在讓自家內容更易於被AI引用的策略,也就是「生成引擎優化」(Generative Engine Optimization)方面的成功。希斯金認為,國家立場媒體盛行的原因顯而易見。AI訓練依賴具有高發布量、廣泛覆蓋面與易取得性的媒體,而這些恰恰是具影響力的國家宣傳媒體的特徵。美國及其他民主國家的優質報紙通常設有付費牆或屏蔽AI爬蟲(AI crawlers)。相比之下,來自卡達、俄羅斯、土耳其與中國的官方媒體內容則自由流通。希斯金也指出,目前AI識讀工作,仍在識別那些似是而非但不正確的「幻覺」,但未來應該對大型語言模型資料來源,進行批判性評估。如果說,美國陽光計畫與保衛民主基金會,各有其政治立場,但今年5月,學術期刊《自然》(Nature)發表的論文〈國家媒體控制如何影響大型語言模型〉(State media control influences large language models),也產生近似結論。包含奧勒岡大學、普渡大學、加州大學聖地牙哥分校、紐約大學、普林斯頓大學等校的研究團隊,在一項涵蓋37個國家的6項連結研究中發現,如果你在一個管控媒體程度較高的國家,用該國語言詢問AI對該國政府與機構的描述時,會獲得比用英文詢問更正面的答覆。比如,以中文提問有關中國政府的問題,會比以英文提問,產生更親政府的回答。這些研究想要表明的是,由國家控制的媒體內容,如何在AI訓練中,影響語言模型對政治問題的回答,尤其是在該國的語言環境中最為顯著。原因之一是,政府可以透過塑造網路媒體環境,進而影響這些系統學習的文本,間接影響大型語言模型。「國家塑造資訊環境,資訊環境塑造訓練資料,訓練資料塑造模型輸出。」因此,加州大學聖地牙哥分校政治學教授Margaret E. Roberts認為,未來大型語言模型會為有能力影響資訊環境的人提供誘因,使他們有動機去思考如何在網路上散布文本。奧勒岡大學社會學助理教授Hannah Waight說,人們常常談論AI,彷彿它是以某種中立的方式從網路上學習,但事實並非如此。它學習的是已經被機構與權力塑造過的資訊環境,而這些環境會在模型的回答中留下可測量的痕跡。也因此,紐約大學學者Joshua Tucker指出,公眾辯論一直聚焦於AI能生成什麼,但這項研究指向了更上游的問題。在AI系統影響政治之前,政治已經在影響AI。為了追蹤這種制度性影響如何滲透訓練過程,研究人員首先證明中國官媒在真實訓練資料中出現的頻率相當高。研究人員將兩個中國官媒來源,與源自Common Crawl的開源多語言資料集進行比對,發現超過310萬份中文文件與官媒存在大量措辭重疊,約占該資料集中文內容的1.64%。這一比例是中文維基百科的40倍以上。在提到中國政治領袖或機構的文件中,這一比例最高達23%。在措辭重疊的文件中,只有12%來自已知的政府或新聞網域,這意味著官媒內容在進入AI訓練語料庫之前,已廣泛擴散至整個網路。更值得警醒的是,研究人員發現,商業模型記住了與這些材料相關的特定措辭,顯示這些內容在訓練過程中被模型反覆看到。「中國官媒內容不只是出現在官方媒體,它還關乎再流通。」普林斯頓大學社會學副教授Brandon M. Stewart說,同樣的措辭經過報紙、APP(如微信公眾號)、貼文轉發和普通網頁,最後它看起來就像廣大資訊環境的一部分。一旦官媒內容進入訓練資料,模型就能將其洗白成看似中立、客觀的資訊。還可以思考的一個問題是,官方媒體宣傳內容,除了容易取得外,它格式固定、重複性高的語言特性,是否與大型語言模型的訓練邏輯契合?因此,官方宣傳內容進入大型語言模型之後,是否更容易普及與被接受?今年3月,《認知科學趨勢》有一篇由南加大三位學者合寫的文章〈大型語言模型對人類表達與思維的同質化效應〉(The homogenizing effect of large language models on human expression and thought)。研究指出,透過反映多數常見的主流模式,大型語言模型促進了風格與概念上的同質化,同時壓制了非主流聲音。隨著大型語言模型在各領域的普及,以及對人們溝通方式的塑造,研究發現它們正在影響並同質化人們的語言、觀點與推理方式。這種同質化不僅源於訓練語料庫的偏差,也透過訓練過程本身得到放大,它偏好頻率高、易於概括的模式,同時抹除少數群體的表達。更可怕的是,這會形成不斷加深的循環。隨著越來越多人使用大型語言模型,語言模型輸出的內容,會被吸收進人類的話語中,開始塑造用戶自身的表達與推理,進而再度成為用來訓練模型的資料,將同質化從被動的偏見,轉化為結構性強化的影響。當AI平台大量使用中國官媒宣傳內容或是中國語料時,在中國與台灣的問題上,非常可能影響使用者的認知。因此,2025年底數位發展部宣布「臺灣主權AI訓練語料庫」正式上線,讓大型語言模型不會只取用簡體中文資料,而缺失台灣用語與觀點。但這應該還只是開始,除了中文數量必須增加外,還需考慮增加不同語言的語料和數量,像是英文,因為畢竟不是所有人都是使用中文的,而未來的AI資訊戰場,應該是包含全世界。 AI的重要組成之一是資料,它獲得什麼資料,就會用這些資料回答。因此,如果有人在上游刻意製造虛假訊息讓AI抓取,經由看似中立的AI輸出,這樣假消息不但會進一步擴散,也可以「洗白」它的消息來源。圖/陳克宇
文・廖書逸/圖・鏡文學今年度的「大英國協短篇小說獎」(Commonwealth Short Story Prize)剛剛於五月中旬公布了2026年的五位區域得主,這五部作品從超過7800件的參賽作品中脫穎而出,代表著大英國協當代短篇小說新銳的最高水準,將共同角逐訂於六月底公布的一位最終得主。在名單公布後,依據傳統,五部獲獎作品亦同步刊登於英國權威文學雜誌《Granta》網站上,供讀者閱讀,同時等候最終得主的誕生。沒想到,得獎作品才公開不到幾天,來自千里達及托巴哥的加勒比海區獎項得主賈米爾・納齊爾(Jamir Nazir),其獲獎小說便遭到許多讀者質疑,似乎利用了生成式 AI 來代筆產出;緊接著,歐洲區與亞洲區的得獎作品也被爆出有 AI 涉入的跡象。由千里達詩人賈米爾・納齊爾所提交的獲獎小說《樹林中的蛇》(The Serpent in the Grove),講述一名農夫對一位女性的苦澀渴望,故事充滿大量隱喻,並在散文、詩歌與加勒比海方言之間來回切換,被評審盛讚為一部「具有安靜權威感的優美傑作」。不過,在小說發佈不久後,前喬治梅森大學AI學者納比爾・庫雷希(Nabeel S. Qureshi)便在社群媒體上公開提出質疑,表示這篇獲獎小說有極大機率是由AI生成,宣稱他在內文中發現了大量的科技足跡。「如果你讀過夠多的ChatGPT文本,你就能像認出熟人的聲音一樣認出它。」庫雷希列舉出作品中的種種AI跡象:首先是句型結構,文中大量出現「不是X,不是Y,而是Z」的句型,這是大型語言模型用來產生論點權威感的習慣用法;其次是有關選用的詞彙,包括在開頭第一句話就被提及、並在整個故事中頻繁出現的「嗡嗡聲」(hum),以及後來由論壇網友補充提出的「酸澀強烈味」(sour tang)這類的感官描寫,都是AI在描寫環境時的常見用語。更讓人起疑的是納齊爾神祕的個人檔案。他在大英國協基金會官網上的獲獎者頭像看起來完美得不可思議,而且最近一年內,他的LinkedIn頁面上張貼了十幾篇關於「AI將如何增強人類能力」的貼文。有讀者往回追溯,發現在他2018年自費出版詩集《夜月愛》那時期的貼文中,充滿了人類常見的拼寫與文法錯誤,但近年卻文風丕變,標點符號的使用也變得完美,讓AI代筆嫌疑甚囂塵上。「ChatGPT贏得了它的第一個重要文學獎⋯⋯可說是AI發展的一大里程碑。」庫雷希在他的文章中語帶諷刺地作結。隨後,風暴進一步擴大,歐洲區馬爾他作家德米科利(John Edward DeMicoli)的作品《堡壘之影》(The Bastion’s Shadow),與亞洲區印度作家阿魯帕拉伊(Sharon Aruparayil)的《曼海蒂之夜》(Mehendi Nights),也被檢測出有AI涉入創作的嫌疑。不過,目前種種爭議的根據,除了讀者拼湊出的蛛絲馬跡,就是第三方AI工具的檢驗。然而,有媒體利用目前較知名的幾個檢測工具進行實測,發現雖然Pangram與Grammarly兩大檢測工具都判定納齊爾的作品為「100%AI生成」,但另外兩款知名平台GPTZero與QuillBot卻又給出「完全由人類撰寫」的相反結果。受限於技術,目前這類型的AI爭議仍然沒有一個公正明確的辦法來進行判定與確認,使得處理起來又更加棘手。大英國協短篇小說獎的前身為大英國協作家獎,在歷史上極具份量,包括《使女的故事》作者瑪格麗特・愛特伍(Margaret Atwood)、《可恥》作者柯慈(J.M. Coetzee)等文學巨擘皆曾獲選為區域得主。此獎於2012年改制後,專注於鼓勵未發表過的全新短篇小說作品,逐漸發展為對文壇新秀而言深具影響力的國際跳板。其賽制將全球國家依地理位置劃分為五大區域,先各自選出一位區域得主,再從五名區域得主中選出一位最終得主。雖然只有大英國協56個成員國的公民才具有參賽資格,但參賽作品卻不侷限於英語創作,而包含有法文、孟加拉文、希臘文等,甚至還有中文;若是作品通過初選,主辦方會出資將這些作品翻譯為英文,再轉交給評審團進行後續評選。面對這場信任危機,涉及的作家們皆沒有做出回應,而主辦方大英國協基金會則是在官網上發表了一份由總幹事拉茲米・法魯克(Razmi Farook)簽署的回應聲明,內容提及不但所有參賽者都需簽署保證作品為自身原創的切結書,所有的決選入圍者更是皆有親口承諾,其創作過程中並沒有AI的涉入。聲明中強調,主辦方極其重視評審過程的完整性,但也解釋了為何不將AI檢測納入其中的原因:「將未發表的原創小說餵給AI檢測器,將會引發有關知情同意與藝術所有權等議題的嚴重疑慮。因此,在完美工具出現前,我們必須基於『信任原則』運作。」目前,負責刊登得獎作品的《Granta》雜誌網站,已在五部獲獎小說的上方都加註了一條免責聲明,表示他們有留意到近期的爭議,同時也承諾,在進一步的審查結果出爐前,故事都將持續保留在網站上。
文・廖書逸/圖・翻攝自 themuse.com美國出版業巨頭「阿歇特圖書集團」(Hachette Book Group)的員工聯盟,在四月底發起了試圖成立工會的連署,並徵集到超過六百位員工的支持,若順利成立,將成為現代出版業史上規模最大的工會。不過,員工的提案在一週內便遭到資方拒絕,工會確定無法直接成立,目前正在等候政府單位核准,預計將在今年六月展開所有員工的匿名投票表決。在等待核准期間,這場勞資僵局在五月中旬有了最新一波進展。資方近日展開高調的反工會宣傳攻勢,除了與勞資關係專家和管理階層的密集會議,更開始全面向員工寄送數位傳單,並在辦公室的公共空間中四處張貼「為什麼我們相信阿歇特在沒有工會的情況下會更強大」及「在工會協商中你可能會失去什麼」等宣傳素材。過去,出版業的工會運動常被侷限在單一總部大樓內,一方面受限於「茶水間串聯」的地理限制,也牽涉到美國勞工法傳統上對於「利益共同體」的認定。但是,這次阿歇特員工聯盟的工會成立連署,透過加密通訊軟體與線上簽署系統,串聯了美國、加拿大辦公室以及遠距工作的員工,加上疫情後法規對職場認定條件的變化,這才打破了以往慣例,締造出破紀錄的連署規模。這次工會運動所提出的核心訴求,除了建立基層員工的最低薪資,拒絕被課「熱情税」、剝削員工對書籍的熱愛;嚴格限制工作時數,拒絕責任制加班;落實多元、平等與包容的承諾,保障遠距工作彈性等條款以外,特別的是,還包括有一系列因應AI時代而生的預防措施。為了趕在AI於出版業中大規模普及之前,建立好防範機制,這次的工會運動特別在談判初期就將AI列為訴求重點之一。工會方預計推動的做法包括有:規定公司不得因引進AI技術而對員工進行裁員或減薪;公司打算引進AI技術時需與員工進行協商;員工有權拒絕使用AI工具,且公司不得因引進AI而強行增加員工工作量;建立一套「AI稿件辨識」的標準流程,並與合作作者簽訂「AI揭露條款」以保障編輯權益等等。面對工會方所施加的壓力,阿歇特資方這兩週也啟動了強硬的資訊戰攻勢。在辦公室裡開始四處可見——同時也有數位版寄送到員工信箱裡——的傳單中,資方詳細列出公司目前提供的各種福利,例如領先業界的平均薪資與無限制的病假等,但隨後就加註警告:「在工會協商的過程中,所有薪資和福利都可能發生變動。一旦協商開始,就沒有任何保障。」並在最後補充,員工「直接與公司談判」將能獲得更好的結果。對此,工會方隨即在社群媒體上反擊,稱資方這種將工會描述為「帶有惡意的第三方」說法是「反工會教戰守則中最老套的論點之一」。工會方強調,他們致力於改善現有條件,任何企圖削減或取消現有福利的舉動,都只會來自資方與管理階層。在接下來的匿名投票表決中,同意票數必須超過有效票數的一半,工會才能夠成立。隨著投票日期即將敲定,這場史上最大規模的出版業工會運動也在逐漸白熱化,其最終結果不但將決定阿歇特六百名員工的未來,更因為它因應AI而生的多項全新條款,若是這些措施順利通過並開啟了傳統出版業的先例,未來或許將成為業界勞動合約的新標竿。
作者/徐淑卿 看到六月底公布的《文策院2025年第一季臺灣出版市場動態》,中文電子書目比上一季增加1219種。出版量排名前十的出版社,有些應是來自對岸簡中轉繁體出版,但不管來自哪裡,都讓人不免好奇:這裡有多少書是AI生成的? 我想像一種出版旅程。若有人在亞馬遜的自助出版(KDP)上架以AI生成的英文書籍,作者可能假借真實人物或虛構,再以AI翻譯成幾種語言,製作成電子書、有聲書,上架到不同語種的大型圖書銷售平台。這應該輕而易舉。 當然,在台灣出中文電子書,毋須繞道亞馬遜,我只是以此假設AI生成書籍來源包含但不限本地製造。尤其若有英文版,有基本訊息的作者資料,有譯者,看起來就像正規的翻譯書了。這種作法可以為出版品的可信度「加值」。 假若AI生成書籍確實充斥銷售通路,但這是台灣目前需要在意的問題嗎?不論電子書或有聲書,現在台灣大平台上都有看似出自AI的出版品,但銷售未必佳。既然賣得不好,就讓它們放著墊底,充實書量,又有什麼關係? 但是,既然AI生成的出版品已經出現在銷售通路,這就是遲早必須面對的問題。有些國家今年已經開始進行規範,像是中國。 現在網路稍作搜尋,就可見教人如何用AI製作電子書的影片。根據《商業內幕》報導,今年美國聯邦貿易委員會對一家公司展開調查。這家公司教客戶如何用AI生成書籍和電子書,在2022年賺了5千萬美元。被調查的原因是,他們對亞馬遜氾濫大量AI生成書籍推波助瀾,而且顧客投訴,這2千美元的課程,若退訂,難以取得退款。 這麼多人趨之若鶩,意味這不是無利可圖,即使銷售不佳,但它以低成本大量生產,一旦上架,就可能被不知情的讀者購買,從而獲得收入。正因為讀者可能購買,就產生許多問題。一,讀者可能從書中獲得錯誤訊息;二,當讀者發現內容有問題時,受騙的感覺使他們對平台與其他出版品失去信任;三,AI大量生成的書籍與人類的創作,價值可以等同嗎?如果沒有清楚標示,價值就會被混淆。最後,AI生成的書籍更容易造假與侵權。 最為人所知且影響深遠的例子就是,美國出版評論家Jane Friedman在2023年8月發表的文章〈I Would Rather See My Books Get Pirated Than This (Or: Why Goodreads and Amazon Are Becoming Dumpster Fires)〉。 有人使用她的名字用AI生成「垃圾書」在亞馬遜出售。這些書名包括:《從零開始打造吸引人的電子書、建立作者平台,並實現利潤最大化》、《如何快速撰寫與出版電子書並賺錢》等。Jane Friedman憤怒的是,這些人利用讀者對她的信任,誤導他們以為這是她的著作,但一旦讀者買了讀了這些書,「卻可能永遠失去對真正作者的信任」。 荒謬的是,要把這些假書從作者資訊中刪除或下架,必須由作者申請,但是誰會有空花這麼多時間監控以你為名的假書上架?Jane Friedman說,當她在推特說這件事時,有位作家跟她說,過去一週,她就申報了29本不實書籍。 Jane Friedman的文章促成一些改變。當年9月,亞馬遜發布新規定,區分AI生成與用AI輔助書籍,若是用AI生成必須告知,但這訊息僅供後台管理,讀者閱覽的前台是看不到的。 亞馬遜的態度說明電商平台的被動。有更多內容上架是首要之務,至於是否有責任或必要性,將AI生成的出版品予以標識,讓讀者作為購買判準,則是另一件事。 平台態度如此,但改變仍在發生。美國作家協會於2023年10月宣布將進行「Human Authored」方案,這是一個表明「非AI創作」的作者身份認證系統,可以讓讀者有所識別。2025年美國作家協會開始實施這個方案,並提供官方標誌,證明作者的身份是人類,而不是AI。 作家協會執行長Mary Rasenberger說,這項認證不是拒絕人工智慧技術,而是幫助讀者信任人類作者的情感和原創性。即使使用人工智慧的拼寫檢查或研究工具,但確保創造本質來自人類智力也很重要。 今年1月韓國文體部發布2025年工作計畫,表示將對人工智慧的快速發展和普及預作準備。今年上半年將修訂《版權法》和頒布《宣傳權法》。首先是推動《版權法》的修訂,包括披露用於人工智慧學習的資料列表的要求。 今年3月中國發布《人工智慧生成合成內容標識辦法》,9月起實施。該辦法提出AI生成合成內容,包含文字、圖片、音訊、視頻、虛擬場景等,必須標識,且從生成階段到平台發布均涵蓋在內。 這些行動與其說是抗拒AI,反而是更清楚認知,未來AI會更大量出現在人們的工作中,因此訂立標識辦法是當務之急。這既可以減少濫竽充數,讓人類的創意和AI生成的產品有所區別。而且,若以AI生成來造假,更應該有法律規範。 尤其最近在美國幾個判例裡,允許一些科技巨頭可以不經擁有版權的作者同意,抓取他們的作品來訓練大型語言模型系統。因為法官認為,如此產生的結果,不是重複或抄襲,而是新事物的變革。但結果是否如此無害,還需觀察後效。尤其不難想像,未來如果有人使用AI生成內容,卻與某些作家作品高度相似,依然會產生法律問題。 AI不僅改變出版生態,而且也在根本上改變寫作的價值。在巴德學院英文系任教的作家徐華,最近在《紐約客》發表文章〈What Happens After A.I. Destroys College Writing?〉,他提到學生大量使用AI如ChatGPT之後,在大學教授寫作的意義和教育的評量標準都在改變。 他說:「教育,特別是在人文領域,建立在一種信念之上:除了學生可能記住的實用知識外,某個課堂上隨口提及的深奧想法,也許會在他們心中扎根,並在多年後開花結果。人工智慧讓我們每個人都能感覺自己像個專家,但真正讓我們成為人類的是,冒險、懷疑與失敗。我經常告訴學生,這可能是你們人生中最後一次,有人必須閱讀你們寫的東西。所以就不如老實告訴我,你們真正的想法。」 我們之所以珍視創作,正是因為它無比艱難,猶如穿鑿洞穴,費時良久才能有一絲創見。而且寫作的過程本身就是作家思考的過程,而這麼珍貴的內在旅程,不但在AI的生成中被省略,而且在銷售通路上一視同仁,毫不甄別。 倒不是認為人類的創作必屬佳作,也不是否定AI對人類工作的幫助。AI的確是很好的研究工具,現在新聞寫作應用AI技術獲獎的作品也很多。但是,就像過去人們買書,除了書的主題,也會按照對出版社、作者的了解,來判斷是否值得購買,這本身有其「品牌」信任度。因此是否是AI生成的書籍,也應該有清楚透明的標誌,來保障消費者的權益。 現在,有越來越多國家正視這個問題,台灣的作法又是什麼?尤其,當今年9月中國施行人工智慧內容必須標識時,直接將中國AI生成書籍,拿到台灣上架的出版品,尤其是有聲書,會保留還是設法免除標識呢? 當AI使用越來越普及,區別並標明「人類創作」或「AI生成合成」,更屬必要。(圖/顏一立)