港產平台代客蒐集數據 用戶效勞取樣省時 供企業訓練AI
原文刊於信報財經新聞「StartupBeat創科鬥室」
要發展人工智能(AI),掌握數據是首要條件。由5名香港大學畢業生成立的初創Datax(集智坊),就專攻數據蒐集這一環,先從全球招攬數據貢獻者,協助AI系統開發者蒐集所需的數據,提升AI系統的訓練效率。Datax創辦人及行政總裁黃偉俊,以及專責技術開發的龍羽騫受訪時表示:「我們協助企業、系統開發人員等,把需要大量動員及時間完成的數據蒐集工作,分派予我們的用戶去完成。簡單來說,Datax是一個中介平台,把開發AI系統的數據蒐集者,以及貢獻數據的Datax用戶連接起來。」
Datax使用者完成任務賺外快
二人以廣告公司作例子:廣告公司從外間收集幾千張海報影像後,連同一些用以蒐集數據的問題和任務上傳至Datax平台,平台就可按其需要及目標客群等,自動分發任務予合適的註冊用戶;用戶可利用Datax手機應用程式完成任務。常見任務包括:在手機屏幕標示海報上的品牌標誌或圈出用戶認為廣告內最牽動情緒的字眼、最矚目的地方等。這些任務旨在找出品牌標誌通常放於海報什麼位置、最吸引消費者的廣告元素是什麼等,並以這些數據訓練AI,從而建立廣告自動生成系統。
此外,對專門研發語音轉文字(Speech to Text)的AI系統,或語音控制家電的科企而言,經由Datax用戶在App錄下指令語句,可建立用來訓練AI系統的語音數據庫。
龍羽騫補充:「如果單單由公司內部團隊錄取語音指令,蒐集到的數據就很有限。」
相比由企業內部程式員花數星期時間自行研發系統或組織Focus Group蒐集數據,企業把蒐集數據工作外判予Datax用戶,可令蒐集數據的時間縮短至三數天,效率大大提升之餘,又可確保取樣多元化,有助客觀、宏觀地訓練AI。
至於蒐集到的數據,可經由後台系統瀏覽,甚至導出至自家系統,方便後期處理。Datax用戶則可透過貢獻數據賺取外快或者超市、網店禮券等。
Datax計劃的意念早於2017年便萌生,當時仍在港大修讀資訊系統及計算機科學學士的黃偉俊,正參與校內一項有關利用AI預示未來時尚趨勢的研究,需要從大量時尚KOL的社交媒體專頁獲取數據,他坦言:「問題是,所謂數據來源,其實都是一張又一張的圖片。」
結果,他要用人手記錄幾萬張圖片中,KOL穿的是什麼類型和顏色的衣服,「這些工作涉及的不過是簡單的Human Judgment,只要找大量空閒的人承包就能完成。」
上述經歷驅使黃偉俊、龍羽騫等5位同系同學開發Datax平台,只是由於當時要兼顧學業,平台要到今年4月才正式推出,至今約有8間公司使用過其服務。黃偉俊指出,客戶一般只要求蒐集約100至200名用戶的數據,目標不難達成,至今未有數據貢獻者不足的情況出現。
Datax現有700名註冊用戶,比例以大學生居多,本地人約有200名,其餘遍及台灣、美國、印度等地區。黃偉俊承認,不論從數目或年齡分布來看,目前規模仍未能完全滿足需求,有必要壯大用戶團隊,「更重要的是客戶,他們提出的蒐集數據任務本身如果有趣及有意義,會較容易吸引用戶。」
參賽學懂先打穩陣腳
團隊現時在港大創新及創業中心iDendron的共享工作間辦公,資金來源除了客戶的服務費,亦來自港大「大學科技初創企業資助計劃」(TSSSU@HKU)、數碼港創意微型基金(CCMF)、香港科技園「Incu-Tech計劃」等,惟目前未有投資者注資。
此外,團隊時常參加不同創業比賽,曾於微軟2018年舉辦的全球大學生創新比賽潛能創意盃(Imagine Cup)「The Big Idea Challenge」賽事奪得第二名。
二人直言,參加創業比賽獲益良多,「(評判及風險投資者)時常問我們,如果亞馬遜之類的科技巨企投放資源,開發跟Datax類似的平台,我們可以如何招架?」黃偉俊表示:「我們應該在本土以至亞洲打穩陣腳,就算大型科企要涉足這類業務並揮軍亞洲,我們將會是它們的收購對象。」
採訪、撰文:陳子健
支持EJ Tech
如欲投稿、報料,發布新聞稿或採訪通知,按這裏聯絡我們。
Related Posts
Latest News
-
供電勢成AI發展瓶頸(車品覺)
人工智能(AI)發展,正以前所未有的速度席捲全球,成為推動科技進步和經濟增長的新引擎。無論選擇在家還是出門,都不能避免用上AI。不過,大家都可能忽視一個隱藏的挑戰:電力供應緊張正悄然逼近。特斯拉(Tesla)創辦人馬斯克(Elon Musk)預言,由於電力需求激增,明年可能無法滿足所有人對AI的運行需求。
- Posted May 8, 2024
- 0
-
太空首次出現藍牙訊號|美國初創成功試驗 藍牙連接衞星
用戶即使身處同一個房間近距離傳輸,藍牙都可能會間中斷線。美企哈勃網絡(Hubble Network)最近完成一項創舉,首次透過地面的藍牙設備,與600多公里以外的太空衞星連接。哈勃網絡解釋,衞星設有專利相控陣列天線,作用就如放大鏡;位於地面的藍牙設備,事前毋須修改硬件,在為現有晶片升級一次軟件後,即可以低功耗、長距離方式,把數據傳輸到哈勃網絡的衞星。
- Posted May 8, 2024
- 0
-
生物科技|mRNA腦癌疫苗 藉免疫反應治病
膠質母細胞瘤(Glioblastoma)是一種最常見,亦是最具侵襲性的腦癌,患者存活期中位數約15個月。美國佛羅里達大學正開發一款mRNA(信使核糖核酸)疫苗,以觸發患者的強烈免疫反應,藉此根治這種惡性腦腫瘤。首次人體臨床試驗會在4名患者身上進行,旨在檢視安全及可行性,已獲美國食品及藥物管理局(FDA)批准,論文發表在學術期刊Cell。
- Posted May 8, 2024
- 0
-
本地創科動態|生產力局夥HP設3D打印技術中心
先進3D打印技術為健康科技、關鍵零部件、電子等行業帶來重要機遇,中小企可藉此生產高價值、客製化的商品。生產力局與惠普(HP)昨達成一項合作協議,將在香港建立「生產力局—HP 3D打印技術中心」。中心將專注於積層製造技術,即3D打印技術的應用研究和開發,旨在成為中試轉化的重要基地;通過先進3D打印技術,提升各行業的競爭力,加速本港智能微工廠及新型工業化發展。
- Posted May 8, 2024
- 0
-
鸚鵡愛視像聊天|模仿群居生活 有助發展動物互聯網
羽毛色彩繽粉的鸚鵡,不但是最聰明的鳥類之一,更屬天生的群居動物。為探索視像聊天擴大鳥類社交生活的潛力,英國格拉斯哥大學與美國東北大學的科學家,為9隻鸚鵡及其主人提供平板電腦,上面設有大而明亮的按鈕,並顯示研究中其他鳥類的照片。照顧者需訓練鸚鵡,當牠想跟屏幕互動時,要按鍵啟動Facebook Messenger。經過為期6個月的研究,發現鸚鵡明顯喜歡視像聊天,多於預先錄製的短片。
- Posted May 8, 2024
- 0
-
AI溫書神器|港大醫科生自創 上傳教材內容 速成記憶卡片
香港大學李嘉誠醫學院二年級生張天俊及陳志誠,過去耗費大量時間製作用於溫習的記憶卡片(Flashcard),後來二人想到以大型語言模型,研發人工智能(AI)網上工具PDF2Anki。程式去年9月推出後,至今錄得約10萬用戶,聲稱醫科知識準確率達90%。
- Posted May 8, 2024
- 0
-
【特約分享】「城市創科大挑戰」現正接受報名!「SENtoR」夥拍「幼聯」醒你參賽心得
想盡情發揮你的大計,為社區帶來正面長遠的影響嗎?以「香港有計」為主題的第二屆「城市創科大挑戰」現正接受報名!通過創新科技推動改變,社會各界人士可就「山人有計(山系)」及「幫人有計(社區關愛)」兩個議題提交創意方案,為香港出謀獻計。
- Posted May 7, 2024
- 0
EJ Tech Video
POPULAR POSTS
- Apple 發布會2024|新代iPad 即將登場!一文看清新品、iPad尺寸、規格、價格預測
- Google裁員|解僱數百核心員工部分職位轉至印度、墨西哥
- 無人機推薦2024|DJI大疆並非一家獨大?Autel Robotics是有力競爭者
- 中美矛盾|外媒:華為秘密資助美國大學前沿研究
- 生物塑膠半年降解|美國研生物複合塑膠 嵌入細菌孢子 遇堆肥激活分化快速降解
- 澳拓商用量子電腦 支援醫療運輸行業
- Apple最新動態|傳設歐洲AI實驗室 廣招Google專家
- AI溫書神器|港大醫科生自創 上傳教材內容 速成記憶卡片
- 中國疑侵權|美國國際貿易委員會調查 GoPro 投訴中企涉嫌侵權
- AI趨勢|LinkedIn創辦人AI分身聆聽動作多