非洲的 1800 億美元疑問：AI 能否學會使用 2000 種本地語言？

非洲的網際網路經濟預計將在 2025 年達到 1800 億美元，並可能在 2050 年飆升至 7120 億美元。預計人工智慧將推動其中大部分增長，到 2030 年，AI 市場估計將達到 165 億美元。然而，語言可能決定了這種增長是否具有包容性。非洲大陸上有超過 2000 種語言被使用，如果科技不能用日常語言與非洲人對話，數位經濟就不可能發揮其全部潛力。

自然語言處理（NLP）是 AI 的分支，使機器能夠理解和生成人類語言，這正是關鍵所在。全球範圍內，NLP 支援語音助理、聊天機器人和翻譯系統。在非洲，其重要性尤為突出，因為大多數數位平台仍然是單語的，默認為英文或法文。因此，大規模的排斥發生了。只有 0.02% 的線上內容是使用非洲語言，使得 AI 模型對於約魯巴語、斯瓦希里語、祖魯語、豪薩語、阿姆哈拉語和其他數百種語言視而不見。

聯合國教科文組織（UNESCO）已經警告說，如果不進行數位化，全球超過 3000 種語言，其中許多是非洲語言，可能會在 2100 年消失。即使是有數千萬使用者的語言在 AI 時代也面臨著邊緣化的風險。

後果是真實存在的。在奈及利亞，用於選民教育的公民科技工具通常排除豪薩語、約魯巴語和伊博語。於肯亞，斯瓦希里語使用者在默認使用英文的數位平台上遇到了障礙。整個大陸，公民無法用自己的語言獲取服務，研究人員稱之為“數位空間中的語言不平等”。這不僅僅是文化議題；它也是一個經濟議題。如果數位服務無法包括當地語言，採用率下降，信任度降低，社會的大片區域仍無法享受到網際網路經濟的好處。

然而，機會是巨大的。NLP 可以將非洲的語言多樣性變成競爭優勢。在金融科技領域，能夠理解皮欽語、豪薩語或斯瓦希里語的聊天機器人已經在擴大對金融服務的使用。奈及利亞的金融科技公司如 Kudi.ai 使用結合英文和本地語言的交互介面來提供小額貸款和行動支付。在醫療保健方面，肯亞的 Uliza Llama 聊天機器人在五種非洲語言中提供產科健康建議，而在馬拉威，UlangiziAI 透過 WhatsApp 用齊切瓦語回答數以千計的農民問題，將回應時間從幾天下降到幾秒鐘。AI 家教和閱讀助手在母語中運作，提升了識字能力和理解力。政府也開始作出回應：南非和肯亞的公民平台正在嘗試使用多語言機器人，讓公民能在祖魯語、斯瓦希里語及其他本地語言中獲得服務。

幾個開創性的專案突顯出了這股動力。奈及利亞開發的 YorubaGPT 是一個受過訓練的約魯巴文本聊天機器人，能在服務 5000 萬約魯巴語使用者的同時保留成語、諺語和文化細微差別。Masakhane 專案是一個泛非洲研究社群，正在為數十個非洲語言對建立機器翻譯模型，展示了合作的力量。2024 年，南非的 Lelapa AI 推出非洲大陸首個多語言大型語言模型 InkúbaLM，支援斯瓦希里語、約魯巴語、豪薩語、科薩語和祖魯語。全球玩家也開始注意。Google 最近將超過 30 種非洲語言添加到 Translate、Gboard 和語音識別中，讓 3 億以上的非洲人能用語音與網路互動。

障礙與挑戰

不過，障礙仍然顯著。數據匱乏是一個最大的。許多非洲語言缺乏用於訓練 AI 模型的大型、乾淨的數據集。許多語言主要是口頭的，具有非標準化的書寫系統，或具有挑戰傳統模型的音調複雜性。基礎設施是另一個關鍵限制。訓練先進的 NLP 模型需要 GPU、可靠的電力和高速網路，而這些資源在大陸許多地區仍然稀缺。技能也十分缺乏。目前非洲約有 70 萬名軟體開發人員，但只有少數受過 AI 和 NLP 的培訓，而其中許多人因腦力流失流失。資金傾向於金融科技和物流初創公司，語言技術卻得不到充分資源支持，儘管其重要性長期存在。而政策框架尚未趕上。雖然肯亞和南非已開始在國家策略中整合 AI，但很少有政府要求提供多語言數位服務或投資於國家語言數據集。

未來的願景

儘管挑戰重重，但未來的方向是明確的。政府應要求公共數位服務以本土語言提供，以立即創造 NLP 解決方案的需求。投資者應意識到，下一波上網的 5 億非洲人主要將使用當地語言，使 NLP 成為進入新市場的門戶。大學和社群必須擴大培訓，建立數據集，並支持開源專案如 Masakhane。科技公司必須承諾以非洲語言開發，否則可能失去對平台的相關性。

這個願景令人信服。想像一下，塞內加爾的農民在播種之前用沃洛夫語諮詢 AI 顧問，德班的青少年用祖魯語 AI 家教學習程式設計，卡洛的患者用豪薩語聊天機器人描述症狀，拉各斯的議會即時使用 AI 將辯論翻譯成約魯巴語、豪薩語、伊博語和英語。這些情景每一個都近在咫尺。它們共同描繪了一個技術適應於人而不是相反的非洲大陸。

藉由擁抱 NLP，非洲不僅可以釋放其數位經濟，也可以為包容性技術設定全球標準。這個 1800 億美元的數字不僅僅是一個經濟目標；它代表著數百萬人受惠於數位經濟。保護 AI 中的非洲語言不僅僅關於遺產；它是在確保未來的機會不會排除任何人。大陸有機會引領全球，展示當 AI 說每個人的語言時，技術變得更加人性化、更加包容和更加公正。