非洲的網際網路經濟預計將在 2025 年達到 1800 億美元,並可能在 2050 年飆升至 7120 億美元。預計人工智慧將推動其中大部分增長,到 2030 年,AI 市場估計將達到 165 億美元。然而,語言可能決定了這種增長是否具有包容性。非洲大陸上有超過 2000 種語言被使用,如果科技不能用日常語言與非洲人對話,數位經濟就不可能發揮其全部潛力。
自然語言處理(NLP)是 AI 的分支,使機器能夠理解和生成人類語言,這正是關鍵所在。全球範圍內,NLP 支援語音助理、聊天機器人和翻譯系統。在非洲,其重要性尤為突出,因為大多數數位平台仍然是單語的,默認為英文或法文。因此,大規模的排斥發生了。只有 0.02% 的線上內容是使用非洲語言,使得 AI 模型對於約魯巴語、斯瓦希里語、祖魯語、豪薩語、阿姆哈拉語和其他數百種語言視而不見。
聯合國教科文組織(UNESCO)已經警告說,如果不進行數位化,全球超過 3000 種語言,其中許多是非洲語言,可能會在 2100 年消失。即使是有數千萬使用者的語言在 AI 時代也面臨著邊緣化的風險。
後果是真實存在的。在奈及利亞,用於選民教育的公民科技工具通常排除豪薩語、約魯巴語和伊博語。於肯亞,斯瓦希里語使用者在默認使用英文的數位平台上遇到了障礙。整個大陸,公民無法用自己的語言獲取服務,研究人員稱之為“數位空間中的語言不平等”。這不僅僅是文化議題;它也是一個經濟議題。如果數位服務無法包括當地語言,採用率下降,信任度降低,社會的大片區域仍無法享受到網際網路經濟的好處。
然而,機會是巨大的。NLP 可以將非洲的語言多樣性變成競爭優勢。在金融科技領域,能夠理解皮欽語、豪薩語或斯瓦希里語的聊天機器人已經在擴大對金融服務的使用。奈及利亞的金融科技公司如 Kudi.ai 使用結合英文和本地語言的交互介面來提供小額貸款和行動支付。在醫療保健方面,肯亞的 Uliza Llama 聊天機器人在五種非洲語言中提供產科健康建議,而在馬拉威,UlangiziAI 透過 WhatsApp 用齊切瓦語回答數以千計的農民問題,將回應時間從幾天下降到幾秒鐘。AI 家教和閱讀助手在母語中運作,提升了識字能力和理解力。政府也開始作出回應:南非和肯亞的公民平台正在嘗試使用多語言機器人,讓公民能在祖魯語、斯瓦希里語及其他本地語言中獲得服務。
幾個開創性的專案突顯出了這股動力。奈及利亞開發的 YorubaGPT 是一個受過訓練的約魯巴文本聊天機器人,能在服務 5000 萬約魯巴語使用者的同時保留成語、諺語和文化細微差別。Masakhane 專案是一個泛非洲研究社群,正在為數十個非洲語言對建立機器翻譯模型,展示了合作的力量。2024 年,南非的 Lelapa AI 推出非洲大陸首個多語言大型語言模型 InkúbaLM,支援斯瓦希里語、約魯巴語、豪薩語、科薩語和祖魯語。全球玩家也開始注意。Google 最近將超過 30 種非洲語言添加到 Translate、Gboard 和語音識別中,讓 3 億以上的非洲人能用語音與網路互動。
障礙與挑戰
不過,障礙仍然顯著。數據匱乏是一個最大的。許多非洲語言缺乏用於訓練 AI 模型的大型、乾淨的數據集。許多語言主要是口頭的,具有非標準化的書寫系統,或具有挑戰傳統模型的音調複雜性。基礎設施是另一個關鍵限制。訓練先進的 NLP 模型需要 GPU、可靠的電力和高速網路,而這些資源在大陸許多地區仍然稀缺。技能也十分缺乏。目前非洲約有 70 萬名軟體開發人員,但只有少數受過 AI 和 NLP 的培訓,而其中許多人因腦力流失流失。資金傾向於金融科技和物流初創公司,語言技術卻得不到充分資源支持,儘管其重要性長期存在。而政策框架尚未趕上。雖然肯亞和南非已開始在國家策略中整合 AI,但很少有政府要求提供多語言數位服務或投資於國家語言數據集。
未來的願景
儘管挑戰重重,但未來的方向是明確的。政府應要求公共數位服務以本土語言提供,以立即創造 NLP 解決方案的需求。投資者應意識到,下一波上網的 5 億非洲人主要將使用當地語言,使 NLP 成為進入新市場的門戶。大學和社群必須擴大培訓,建立數據集,並支持開源專案如 Masakhane。科技公司必須承諾以非洲語言開發,否則可能失去對平台的相關性。
這個願景令人信服。想像一下,塞內加爾的農民在播種之前用沃洛夫語諮詢 AI 顧問,德班的青少年用祖魯語 AI 家教學習程式設計,卡洛的患者用豪薩語聊天機器人描述症狀,拉各斯的議會即時使用 AI 將辯論翻譯成約魯巴語、豪薩語、伊博語和英語。這些情景每一個都近在咫尺。它們共同描繪了一個技術適應於人而不是相反的非洲大陸。
藉由擁抱 NLP,非洲不僅可以釋放其數位經濟,也可以為包容性技術設定全球標準。這個 1800 億美元的數字不僅僅是一個經濟目標;它代表著數百萬人受惠於數位經濟。保護 AI 中的非洲語言不僅僅關於遺產;它是在確保未來的機會不會排除任何人。大陸有機會引領全球,展示當 AI 說每個人的語言時,技術變得更加人性化、更加包容和更加公正。