Oxylabs首席治理和戰略官Denas Grybauskas-訪談系列

Denas Grybauskas是Oxylabs的首席治理和戰略官,Oxylabs是Web Intelligence Collection和Premium代理解決方案的全球領導者。

Oxylabs成立於2015年,提供了世界上最大的倫理採購的代理網絡之一 – 在195個國家 /地區範圍內超過1.77億個IP,並帶有高級工具,例如Web Unblocker,Web Scraper API和Oxycopilot,Oxycopilot,AI驅動的刮擦助手將自然語言轉換為結構性數據質量。

您在立陶宛的法律技術領域進行了令人印象深刻的法律和治理之旅。是什麼促使您在您在Oxylabs中的角色來應對AI最兩極分化的挑戰之一,即倫理學和版權?

Oxylabs一直是該行業負責創新的旗桿。我們是第一個倡導道德代理採購和網絡刮擦行業標準的人。現在,隨著AI的移動如此之快,我們必須確保創新與責任保持平衡。

我們認為這是AI行業面臨的一個巨大問題,我們也可以看到解決方案。通過提供這些數據集,我們可以使AI公司和創作者在同一頁面上有關公平AI開發的開發,這對參與其中的每個人都是有益的。我們知道將創作者的權利置於最前沿,同時也為未來AI系統的開發提供了內容,因此我們創建了這些數據集作為可以滿足當今市場需求的東西。

英國正處於激烈的版權戰中,雙方都有強烈的聲音。您如何解釋AI創新與創作者權利之間辯論的當前狀態?

雖然英國政府重要的是要優先考慮生產性技術創新,但創作者應該受到AI的增強和保護,而不是被偷走了,這一點至關重要。目前正在辯論的法律框架必須在促進創新之間找到一個甜蜜的地方,同時保護創作者,我希望在接下來的幾周中,我們看到他們找到了一種實現平衡的方法。

Oxylabs剛剛啟動了世界上第一個YouTube的YouTube數據集,該數據集需要創建者同意進行AI培訓。此同意過程如何工作?對於音樂或出版等其他行業,它的可擴展性如何?

數據集中的所有原始視頻中的所有原始視頻均均已明確地同意創建者,用於AI培訓,通過道德連接創建者和創新者。 Oxylab提供的所有數據集都包括視頻,成績單和豐富的元數據。儘管此類數據具有許多潛在的用例,但Oxylabs精製並專門為AI培訓準備,這是內容創建者有意識地同意的用途。

許多科技領導者認為,要求所有創作者明確選擇加入可以“殺死” AI行業。您對該主張的反應是什麼? oxylabs的方法如何證明?

要求,對於AI培訓的每種材料使用,先前的明確選擇都會提出重大的運營挑戰,並將以大量的AI創新成本。它可以無意中激勵公司將開發活動轉移到嚴格執法或不同版權制度的轄區中,而不是保護創作者的權利。但是,這並不意味著在尊重版權時沒有鼓勵AI開發的中間立場。相反,我們需要的是可行的機制,可以簡化AI公司與創建者之間的關係。

這些數據集提供了一種前進的方法。除非版權所有者明確選擇退出,否則可以使用哪些內容的選擇模型。第三種方法是通過在線平台等技術解決方案來促進出版商,創作者和AI公司之間的交易。

最終,任何解決方案都必須在適用的版權和數據保護法的範圍內運行。在Oxylabs,我們認為必須負責任地追求AI創新,而我們的目標是為合法的實用框架做出貢獻,這些框架尊重創作者的同時實現進步。

您的團隊必須克服的最大障礙是使基於同意的數據集可行的最大障礙?

YouTube為我們打開了道路,使內容創建者能夠輕鬆,方便地許可他們的工作進行AI培訓。之後,我們的工作主要是技術性的,涉及收集數據,清潔和構造以準備數據集並構建整個技術設置,以供公司訪問所需的數據。但這是我們多年來一直在某種程度上做的事情。當然,每種情況都提出了自己的一系列挑戰,尤其是當您處理像多模式數據一樣龐大而復雜的事物時。但是我們既有知識和技術能力。鑑於此,一旦YouTube作者有機會給予同意,其餘的只是將我們的時間和資源投入其中的問題。

除了YouTube內容之外,您是否設想了其他主要內容類型(例如音樂,寫作或數字藝術)的未來,還可以系統地將其用作培訓數據?

一段時間以來,我們一直在指出有必要採用系統的方法來同意和內容許可,以便在平衡創建者權利的同時實現AI創新。只有在雙方都有方便且合作的方式實現目標時,才會有相互利益。

這只是開始。我們認為,在各個行業中提供像我們這樣的數據集可以提供一種解決方案,最終將版權辯論帶入友好的封閉。

諸如Oxylabs的倫理數據集之類的產品的重要性是否取決於歐盟,英國和其他司法管轄區的不同AI治理方法?

一方面,基於明確的數據集的可用性將基於政府傾向於更嚴格法規的司法管轄區的AI公司的領域置於領域。這些公司的主要關注點是,與創作者相比,獲得嚴格的同意規則只會給其他司法管轄區的AI開發人員帶來不公平的優勢。問題不是這些公司不關心同意,而是沒有方便的方法來獲得同意,他們注定要落後。

另一方面,我們認為,如果簡化了授予同意並訪問獲得AI培訓的數據,則沒有理由使這種方法不應成為全球首選的方式。我們基於許可的YouTube內容的數據集是邁向這種簡化的一步。

由於公眾對AI的培訓方式越來越不信任,您如何認為透明度和同意可以成為科技公司的競爭優勢?

儘管透明度通常被視為對競爭優勢的障礙,但它也是我們對抗不信任的最大武器。 AI公司可以提供的透明度越多,就越有證據表明道德和有益的AI培訓,從而重建對AI行業的信任。反過來,創造者看到他們和社會可以從AI創新中獲得價值,將來有更多理由在將來同意。

Oxylabs通常與數據刮擦和Web智能有關。這項新的道德倡議如何適應公司的更廣泛願景?

YouTube數據集的釋放延續了我們在Oxylabs的使命,以建立和促進道德行業實踐。為此,我們共同創立了道德網絡數據收集計劃(EWDCI),並引入了一個行業優先的透明層框架,用於代理採購。我們還啟動了4β項目的一部分,以使研究人員和學者能夠最大程度地發揮其研究影響並增強對關鍵公共網絡數據的理解。

展望未來,您是否認為政府應遵守默認同意書培訓數據,還是應該仍然是志願行業領導的倡議?

在自由的市場經濟中,通常最好讓市場糾正自己。通過允許創新來響應市場需求,我們不斷重塑和更新我們的繁榮。重型立法從來都不是一個不錯的第一選擇,只有在允許創新的所有其他途徑確保正義的途徑耗盡時,才應訴諸於努力。

看起來我們已經在AI培訓中已經達到了這一點。 YouTube為創建者和我們的數據集提供的許可選項表明,該生態系統正在積極尋求適應新現實的方法。因此,雖然明確的法規當然需要確保每個人都在其權利中行事,但政府可能希望輕易踩踏。他們可能不需要在每種情況下都需要明確的同意,而是想研究行業可以開發解決當前緊張局勢的機制的方式,並在立法時從該行動中獲得提示,以鼓勵創新而不是阻礙創新。

您將為想要優先考慮道德數據使用的初創企業和AI開發人員而不拖延創新嗎?

初創企業可以幫助促進道德數據的一種方式是開發技術解決方案,以簡化獲得同意和衍生價值的過程。作為獲取透明採購數據的選項,AI公司無需妥協速度。因此,我建議他們睜開眼睛,以供此類產品。

感謝您的出色採訪,希望了解更多的讀者應該參觀Oxylabs。

Source link

Scroll to Top