獲得培訓AI聊天機器人的報酬
獲得培訓AI聊天機器人的報酬不僅僅是引人入勝的標題。 Yupp這樣的平台使這是一個真正的機會,它正在改變人工智能如何通過社區驅動的反饋來學習。由Google前工程師Peter Redmond建造,Yupp允許用戶通過通過互動,評級和建議任務來幫助提高聊天機器人的性能來賺取加密貨幣。該模型不僅激勵人類的反饋,而且通過分散培訓過程來使AI發展民主化。在本文中,您將發現Yupp的工作原理,與傳統的AI培訓計劃的比較以及一些道德上的考慮。
關鍵要點
- Yupp通過及時的互動和響應反饋來培訓AI聊天機器人,向用戶付費。
- 該平台的賞金系統基於其在改善模型輸出中的輸入的價值獎勵用戶。
- 與集中的人工智能培訓工作不同,Yupp使用了專注於道德數據收集的分散和遊戲化模型。
- 風險包括數據操作和對齊偏差,使得適度和透明度至關重要。
什麼是Yupp,它如何工作?
Yupp是一個AI聊天機器人培訓平台,可擠滿人類的反饋以改善其模型。它邀請用戶參與AI生成的內容,並通過提交文本響應,投票或降價聊天機器人答復以及糾正有缺陷的輸出來做出貢獻。 Yupp建立在區塊鏈基礎設施的基礎上,用加密代幣而不是菲亞特付款獎勵貢獻者,這構成了更廣泛的分散經濟的一部分。
這是Yupp培訓循環的運作方式:
- 用戶收到提示或與AI模型進行腳本對話。
- AI響應,用戶必須對答復進行評分,修改或上下文化。
- 根據實用程序和驗證,評估用戶操作並將其添加到獎勵隊列中。
- 一旦驗證反饋並有助於改善未來的模型迭代,就會分發令牌。
賞金系統:遊戲人類反饋
Yupp包括一個透明的賞金系統。每個貢獻任務,無論是對聊天機器人的回复,編輯更好的上下文還是建議改進,都有一個令牌賞金。更有價值或更複雜的任務獲得更高的獎勵。此過程類似於網絡安全設置中發現的錯誤賞金程序,旨在快速擴展,同時通過同行驗證來保持質量。
令牌分配取決於社區審查和AI改進的證據。例如:
- 被納入模型的修訂響應可獲得一個完整的賞金。
- 差的或無關的反饋可能被排除或獲得降低的獎勵。
- 頂級貢獻者可能會成為主持人,並有助於驗證他人的提交。
Yupp與傳統的AI反饋工作有何不同
諸如CHATGPT之類的模型的標準AI培訓系統依賴於私人集中公司內人類反饋的強化學習。通常,工人在諸如AI或Remotasks之類的演出平台上被雇用,在該平台上,通過應用程序和能力測試對工作訪問進行過濾。 Yupp引入了顯著差異。
- 公眾可見性: 社區成員可以查看培訓數據,討論質量並從公開審核中學習。
- 公開參與: 無需正式的申請過程,使系統更具包容性。
- 加密補償: 貢獻者會賺取基於區塊鏈的令牌,可以交換或固定。
- 遊戲機制: 該平台使用排行榜和獎勵層來鼓勵一致的反饋。
通過這種結構,與傳統的基於演出的AI工作相比,Yupp提出了更開放和潛在的道德替代方案。任務涉及直接參與和周到的反饋。例如,許多用戶改善了響應或提交改進對話基調的改革,類似於人類機器協作的真實故事中所討論的內容。
眾包人工智能培訓的道德意義
將成千上萬的用戶引入AI開發引入了機會和關注。開放訪問如果未經修改,可能會造成偏見風險。用戶組可能會嘗試使模型行為偏斜,這將破壞長期有效性。
Yupp通過以下方式應對這些挑戰:
- 分層投票權: 聲譽會影響用戶反饋帶來的重量。
- 數據可追溯性: 記錄了貢獻,可見可見,可減少操縱的機會。
- 主持人監督: 值得信賴的貢獻者組成了一個節制有爭議的內容的節制理事會。
該框架平衡了權力下放與監督,增強了公平和透明度。它還支持人類在循環AI訓練的概念,在該培訓中,人們仍然是更新周期的一部分,而不是將數據策劃完全移交給機器。
有人可以參加Yupp上的培訓機器人嗎?
是的,參與對符合一些基本標準的全球用戶開放:
- 您必須有一個兼容的加密錢包地址,例如metamask。
- 您需要準確地理解和寫作。
- 需要訪問桌面或移動瀏覽器以及工作的Internet連接。
不需要技術專長。許多用戶從簡單的反饋任務開始,並通過提交改進或審查響應來逐漸發展經驗。如果您對人們如何開始構建這些AI工具感到好奇,請參閱本指南以不編碼而製作AI聊天機器人。
將Yupp與其他AI培訓平台進行比較
該表概述了Yupp如何與其他AI培訓平台堆疊:
平台 | 獎勵類型 | 訪問類型 | 道德模型 |
---|---|---|---|
Yupp | 加密令牌(鏈) | 公開註冊 | 分散,透明 |
CHATGPT反饋(OpenAi) | 每小時付款(美元) | 合同工作 | 私人,公司結盟 |
Kajiwoto | 訂閱收入共享 | 應用程序構建器受眾 | 用戶控制的行為 |
縮放AI | 每個任務付款 | 需要申請 | 公司合同 |
常見問題:關於在Yupp上培訓AI的重要問題
您如何開始Yupp?
您可以首先訪問Yupp網站並連接加密錢包。之後,選擇專注於聊天機器人響應質量或重新練習的入門級任務。
如何計算令牌獎勵?
每個提交的任務都基於復雜性具有點值。經過驗證和用於改善AI的任務大大提高了您的獎勵潛力。一些回應可能會根據社區驗證獲得獎金支出。
您可以撤回或交換Yupp令牌嗎?
是的。令牌遵循既定的區塊鏈標準。一旦獲得,它們就可以在受支持的市場上交換,也可以在平台內用於高級工具。您也可以選擇將令牌放置。
您需要什麼硬件或軟件?
您只需要一個標準瀏覽器,例如Chrome,穩定的Internet連接,鍵盤和您的加密錢包才能進行支出。無需額外的工具或軟件。
人工智能發展正在迅速發展。現在,更多的系統需要新鮮的,多樣化的輸入才能在現實世界中有效。封閉的培訓平台依靠孤立的勞動池和有限的監督。相比之下,Yupp將貢獻者的激勵措施與質量改善和道德責任制保持一致。任何有興趣改善數據標籤的人還可以探索類似地影響許多AI系統的適當圖像標籤的挑戰。