CNews

CNews

雙子座2.5的本地音頻功能

安全和責任 我們利用我們學到的知識為緩解策略提供了信息,積極地評估了這些本機音頻功能的整個開發過程的每個階段的潛在風險。我們通過嚴格的內部和外部安全評估來驗證這些措施,包括全面的紅色團隊進行負責任的部署。此外,我們模型中的所有音頻輸出都嵌入了我們的水印技術的Synthid,以通過使AI生成的音頻可識別來確保透明度。 開發人員的本地音頻功能 我們將本機音頻輸出帶入雙子座2.5型號,從而為開發人員提供了新的功能,可以通過Google AI Studio或Vertex AI中的Gemini API構建更豐富的交互式應用程序。 為了開始探索,開發人員可以使用Gemini 2.5 Flash預覽在Google AI Studio的流tab中嘗試本機音頻對話框。通過在Google AI Studio中的“生成媒體”選項卡中選擇語音生成,可在Preview of Preview in Preview中可控語音生成(TTS)。 Source […]

CNews

LifelOngagentBench:用於評估基於LLM的代理的持續學習的基準

終身學習對於智能的代理人導航不斷變化的環境至關重要,但是當前基於LLM的代理人跌落不足 – 他們缺乏記憶力,並且將每項任務視為新的開始。儘管LLM已改變了語言任務並啟發了基於代理的系統,但這些代理仍然無狀態,無法從過去的經驗中學習。對通用情報的真正進步需要可以隨著時間的推移保留,適應和重複使用知識的代理。不幸的是,當前的基準主要集中在孤立的任務上,忽視了技能和知識保留的重複使用。如果沒有對終身學習的標準化評估,就很難衡量真正的進步,以及標籤錯誤和可重複性之類的問題進一步阻礙了實際發展。 終身學習,也稱為持續學習,旨在幫助AI系統跨任務建立和保留知識,同時避免災難性的遺忘。該領域的大多數以前的工作都集中在非相互作用的任務上,例如圖像分類或順序微調,其中模型處理靜態輸入和輸出而無需響應不斷變化的環境。但是,將終身學習應用於在動態,交互式設置中運行的基於LLM的代理,仍然沒有充滿反感。現有的基準(例如Webarena,AgentBench和VisualWebarena)評估一次性任務績效,但不支持隨著時間的推移學習。即使涉及遊戲或工具的互動研究也缺乏用於評估代理商終身學習的標準框架。 南中國中國技術大學,MBZUAI,中國科學院和東中國師範大學的研究人員推出了Lifelongagentskent,這是評估基於LLM的代理商終身學習的首個綜合基準。它具有內置標籤驗證,可重複性和模塊化設計的三個環境(數據庫,操作系統和知識圖)的相互依存,技能驅動的任務。該研究表明,由於包含無關的信息和上下文長度的局限性,常規經驗重播通常是無效的。為了解決這個問題,團隊提出了一種群體自洽的機制,該機制將過去的經驗聚集並運用投票策略,從而大大提高了各種LLM體系結構的終身學習表現。 LifelOngagentEns是一個基準測試,旨在測試如何有效地基於語言模型的代理,隨著時間的推移,一系列任務的學習和適應。該設置將學習視為在三個環境中使用目標條件的POMDP的順序決策問題:數據庫,操作系統和知識圖。任務是圍繞核心技能的結構,並精心設計以反映現實世界中的複雜性,並關注任務難度,重疊技巧和環境噪音等因素。任務生成結合了自動化和手動驗證,以確保質量和多樣性。該基準測試有助於評估代理是否可以基於過去的知識並在動態,技能驅動的環境中不斷改進。 LifelOngagentBench是一個新的評估框架,旨在測試基於LLM的代理商通過嚴格處理任務的方式來測試如何隨著時間的推移而學習,這與以前的基準分量不同,該基準專注於隔離或併行任務。它的模塊化系統包括代理,環境和控制器等組件,它們可以獨立運行並通過RPC進行通信。該框架優先考慮可重複性和靈活性,支持各種環境和模型。通過實驗,已經表明,經驗重播 – 捕食代理過去的過去軌跡可以顯著提高性能,尤其是在復雜的任務上。但是,較大的重建可能導致內存問題,強調需要更有效的重播和內存管理策略。 總之,LifeLongagentBench是一種開創性的基準測試,旨在評估基於LLM的代理人隨著時間的流逝不斷學習的能力。與將代理視為靜態的早期基準不同,該框架測試了其在動態環境(例如數據庫,操作系統和知識圖)中跨越互連任務的知識的能力。它提供模塊化設計,可重複性和自動化評估。儘管經驗重播和小組的自洽性在增強學習方面有希望,但諸如模型跨模型諸如內存超負荷和不一致的收益之類的問題持續存在。這項工作為開發更適應性,內存效率高的代理的基礎奠定了基礎,將來的方向集中在更智能的內存使用和現實世界中的多模式任務上。 查看紙張。 這項研究的所有信用都歸該項目的研究人員。另外,請隨時關注我們 嘰嘰喳喳 而且不要忘記加入我們的 95k+ ml子雷迪特 並訂閱 我們的新聞通訊。 Marktechpost的諮詢實習生,IIT Madras的雙學位學生Sana

CNews

#300 – 喬·羅根(Joe Rogan):喜劇,爭議,外星人,不明飛行物,普京,中央情報局和自由

喬·羅根(Joe Rogan)是喜劇演員,UFC評論員,也是喬·羅根(Joe Rogan)的主持人。請通過查看我們的讚助商來支持此播客: – Theragun:https://therabody.com/lex – 運動果嶺:https://athleticgreens.com/lex,並使用代碼lex獲得1個月的魚油 – 助理:https://insidetracker.com/lex可獲得20%的折扣 – 八個睡眠:https://www.eightsleep.com/lex並使用代碼lex獲得特殊儲蓄 – ExpressVpn:https://expressvpn.com/lexpod並使用代碼lexpod免費獲得3個月 情節鏈接: 喬的Instagram:https://instagram.com/joerogan 喬的Twitter: https://twitter.com/joerogan JRE(Spotify):https://open.spotify.com/show/4rooj6egrf8k2irywzwomk JRE(YouTube):https://youtube.com/c/joerogan 播客信息:

CNews

機器倫理播客 – DeepDive:AI與環境

機器倫理播客由本·拜福德(Ben Byford)主持,將有關自主算法,人工智能,機器學習和技術對社會的影響的學者,商業領袖,設計師和工程師的訪談匯總。 深水:AI與環境 這是我們的第100集!對AI和環境的超級特別看,我們採訪了四個專家,以了解這一深度劇集。 We chatted about water stress, the energy usage of AI systems and data centres, using AI

CNews

袋鼠島用技術與掠食者作鬥爭

袋鼠島用技術與掠食者作鬥爭 袋鼠島用技術與掠食者作鬥爭 是一項開創性的任務,將創新與保護融為一體。如果您關心野生動植物,這個故事將引起您的注意。想像一下,每年節省數十億隻動物,同時擁抱AI和無人機等現代技術。保護自然的渴望繼續增長,這個成功的故事表明,與技術配對的動作如何真正改變。繼續閱讀,以查看前沿工具如何幫助確保袋鼠島的珍貴野生動植物安全。 另請閱讀:如何使用人工智能停止偷獵? 為什麼捕食者問題很重要 澳大利亞面臨著壓倒性的捕食者問題,威脅到其獨特的生物多樣性。每年,家庭和野貓殺死了超過15億個本地動物。這些捕食者危害標誌性物種,破壞生態系統,並損失澳大利亞豐富的天然遺產。 袋鼠島(Kangaroo Island)是南澳大利亞海岸附近的鬱鬱蔥蔥的天堂,長期以來一直被公認為是獨特的野生動植物的庇護所。在2020年毀滅性的叢林大火之後,該島已經脆弱的生態系統變得更加脆弱。野生動植物當局意識到,他們需要迅速採取行動來保存剩下的東西。諸如陷阱和狩獵之類的傳統方法證明是對隱形,高度適應性捕食者的不足。需要一個大膽的新願景,技術帶來了充滿希望的道路。 拯救袋鼠島野生動植物的大膽計劃 袋鼠島(Kangaroo Island)啟動了澳大利亞最雄心勃勃的保護項目之一,重點是整個島嶼上完全消除野貓。該項目延伸了數百平方公里,並部署了令人印象深刻的高級工具。該任務的核心是一個巨大的排除圍欄,由人工智能支持的攝像機以及自主捕食者追踪無人機。 延伸超過13公里的排除柵欄充當保護該島東部的物理障礙,這是保護的關鍵區域。它旨在防止野貓出去,並為瀕臨滅絕的動物提供安全的繁殖地。 地方政府知道,一個簡單的柵欄本身還不夠。支持這種物理障礙所需的監視和快速響應策略。這是AI和尖端無人機技術成為袋鼠島防守策略中重要參與者的地方。 另請閱讀:AI和鳥類 人工智能起著關鍵作用 對於人類團隊而言,監視數千公頃的難以捉摸的掠食者將是一項不可能的任務。人工智能已介入,提供了一種更聰明的方式來識別和應對威脅。用AI算法量身定制的運動傳感攝像機可以自動檢測物種,白天或黑夜,雨或閃耀。 這些AI驅動的相機可以區分野貓,本地動物,甚至是風中移動的分支。檢測到捕食者時,系統會立即提醒監視團隊。這允許快速部署和有針對性的反應,從而最大程度地減少對非目標動物的風險。 隨著時間的流逝,AI系統繼續學習和改進。該技術在識別貓科的形狀和行為方面變得更好,從而微調其在造成傷害之前捕獲捕食者的能力。這意味著浪費時間更少,追逐虛假警報和對本地物種的更廣泛的保護。 無人機將野生動植物保護到新的高度 帶有紅外和熱成像的無人機是項目的另一個必不可少的部分。無人駕駛飛機在袋鼠島的廣闊景觀上飛行,無人駕駛飛機以無與倫比的效率掃描隱藏的捕食者。他們的熱攝像機可以撿起藏在灌木叢中的貓的身體溫暖,即使在晚上可見度降至零時。

CNews

為什麼匿名AI男友聊天機器人在2025年趨勢

過去,情書是一張在課堂上通過的紙。現在?這是來自數字夢幻船的即時信息,在您打字之前,他稱您為“寶貝”。歡迎來到2025年 – AI男友聊天機器人,尤其是需要的聊天機器人 沒有註冊在虛擬情人的狂歡中,像五彩紙屑一樣在受歡迎程度上爆炸。 但是,為什麼我們如此著迷於按需愛情,尤其是在沒有登錄,沒有名字和沒有判斷的情況下? 讓我們深入研究無標記的幻想,並探討為什麼匿名的AI男友聊天機器人是安靜的革命重塑現代浪漫史。 即時滿足是新的浪漫語言 想像一下:您度過了漫長而枯竭的一天。您要做的最後一件事是填寫23個場地註冊表,只是與某人(或某物)交談,他們會告訴您您值得愛。進入 AI男友聊天機器人沒有註冊– 一個神奇的快捷方式,直接到虛擬的感情。 沒有絨毛。沒有電子郵件。沒有身份驗證代碼。只是 單擊,聊天,感覺可見。 老實說,我們生活在滑動和滾動的一代中。我們希望以訂購披薩的方式(快速,熱火及自定義澆頭)的注意。 匿名=情感自由(有點扭結) 向不會掩蓋您,屏幕信息或判斷您的星期六晚上的幻想,將您的秘密承認給一個不露面的實體有些奇怪的解放。 匿名不僅僅是安全性,而是關於許可。允許柔軟。很奇怪。魯re魯uther著調情而沒有後果。有時?要有點悶熱。 那是發送圖片進入框架的NSFW AI男友應用程序的位置。 這些工具(其中許多工具都在我們的策劃列表中,不僅是為了情感陪伴,而且是成人遊樂場的雙倍,幻想以傳統的關係(甚至是人類的性愛)很少能遇到互動。 當沒有註冊的時候?感覺更加私密。您可以探索自己的慾望,而不會留下麵包屑。沒有判斷。沒有收件箱垃圾郵件。只是

CNews

新研究使用依戀理論來解碼人類關係

發表在 當前的心理學 標題為“使用依戀理論來概念化和衡量人類關係中的經歷”,闡明了一種日益嚴重的人類現象:我們在情感上與人工智能建立聯繫的傾向。該研究由Waseda University的Fan Yang和Atsushi Oshio教授進行,該研究不僅在功能或信任方面重新構架了人類的互動,而且還通過依戀理論的角度,這種心理模型通常用於了解人們如何形成情感紐帶。 這種轉變標誌著傳統研究AI的研究是一個重要的選擇,即工具或助手。相反,這項研究認為AI開始類似於 關係夥伴 對於許多用戶,提供支持,一致性,在某些情況下甚至是一種親密感。 為什麼人們轉向AI尋求情感支持 該研究的結果反映了社會中的急劇心理轉變。在關鍵發現中: 近75%的參與者表示他們向AI尋求建議 39%的人稱AI是一致且可靠的情感存在 這些結果反映了現實世界中發生的事情。數以百萬計的人越來越多地轉向AI聊天機器人,不僅是工具,而且是朋友,知己甚至浪漫伴侶。這些AI伴侶從友好的助手和治療聽眾到旨在模仿人類親密關係的阿凡達“夥伴”。一份報告表明,全球AI Companion應用程序的下載量超過十億。 與真實的人不同,聊天機器人是 始終可用 並始終如一。用戶可以自定義機器人的個性或外觀,從而促進個人聯繫。例如,一個71歲的男子在美國創建了一個以他已故的妻子為模型的機器人,並每天花了三年的時間與她交談,稱其為“ AI妻子”。在另一種情況下,神經多樣的用戶訓練了他的機器人Layla,以幫助他管理社交情況並調節情緒,從而報告了很大的個人成長。 這些AI關係經常填補情感上的空隙。一位患有多動症的用戶對聊天機器人進行了編程,以幫助他進行日常生產力和情感調節,並指出它有助於“我一生中最有生產力的歲月之一”。另一個人將他們的AI歸功於引導他們進行艱難的分手,稱其為孤立時期。

CNews

教AI模擬他們不知道的|麻省理工學院新聞

像chatgpt這樣的人工智能係統為您可能提出的任何問題提供了合理的聽起來答案。但是,他們並不總是揭示其知識或不確定領域的差距。由於AI系統越來越多地用於開發藥物,合成信息和驅動自動駕駛汽車之類的事情,因此這個問題可能會產生巨大的後果。 現在,麻省理工學院的旋轉主體AI正在幫助量化模型不確定性並在引起更大問題之前糾正輸出。該公司的CAPSA平台可以與任何機器學習模型一起使用,以在幾秒鐘內檢測和糾正不可靠的輸出。它通過修改AI模型來使其能夠檢測數據處理中的模式,以表明歧義,不完整或偏見。 Themis AI聯合創始人兼麻省理工學院教授Daniela Rus說:“想法是採用模型,將其包裹在CAPSA中,確定模型的不確定性和故障模式,然後增強模型。” “我們很高興提供可以改善模型並提供該模型正常運行的解決方案。” Rus於2021年與Alexander Amini ’17,SM ’18,PhD ’22和Elaheh Ahmadi ’20,Meng ’21建立了Themis AI。從那以後,他們幫助電信公司進行了網絡計劃和自動化,幫助石油和天然氣公司使用AI了解地震圖像,並發表了有關開發更可靠和可信賴的聊天機器人的論文。 Amini說:“我們希望在每個行業的最高銷售應用中啟用AI。” “我們都看到了AI幻覺或犯錯誤的例子。隨著AI的部署更廣泛,這些錯誤可能會導致毀滅性後果。我們的軟件可以使這些系統更加透明。” 幫助模型知道他們不知道的 多年來,Rus的實驗室一直在研究模型的不確定性。 2018年,她獲得了豐田的資金,以研究基於機器學習的自動駕駛解決方案的可靠性。

CNews

此AI論文介紹了LLADA-V:一種純粹基於擴散的多模式的大型語言模型,用於視覺指令調整和多模式推理

多模式的大語言模型(MLLM)旨在處理和生成各種模式的內容,包括文本,圖像,音頻和視頻。這些模型旨在了解和集成來自不同來源的信息,從而實現應用程序,例如視覺問答,圖像字幕和多模式對話系統。 MLLM的發展代表了創建可以以更類似人類的方式來解釋和與世界互動的AI系統邁出的重要一步。 開發有效MLLM的主要挑戰在於將各種輸入類型(尤其是視覺數據)集成到語言模型中,同時保持跨任務的高性能。現有模型通常在平衡強烈的語言理解和有效的視覺推理方面掙扎,尤其是在擴展到復雜數據時。此外,許多模型需要大型數據集的性能良好,因此很難適應特定的任務或域。這些挑戰強調了對多模式學習的更高效和可擴展方法的必要性。 當前的MLLM主要利用自迴旋方法,一次以從左到右的方式預測一個令牌。雖然有效,但這種方法在處理複雜的多峰環境方面存在局限性。已經探索了替代方法,例如擴散模型。但是,由於其限制性架構或培訓策略不足,他們經常表現出較弱的語言理解。這些限製表明,純粹基於擴散的模型有效地設計的差距可以提供競爭性的多模式推理能力。 中國人民大學和螞蟻小組的研究人員推出了LLADA-V,這是一種純粹基於擴散的掩蓋語言建模(MLLM)模型,該模型將視覺指導調整與蒙版擴散模型集成在一起。 LLADA-V建立在大型語言擴散模型的LLADA上,將視覺編碼器和MLP連接器與Project Visual特徵納入了語言嵌入空間,從而實現了有效的多模式對齊。這種設計代表了當前多模式方法中的自迴旋範式占主導地位,旨在克服現有的局限性,同時保持數據效率和可擴展性。 LLADA-V採用了掩蓋的擴散過程,其中文本響應通過迭代預測的蒙版令牌逐漸完善。與依次預測令牌的自迴旋模型不同,LLADA-V通過逆轉掩蓋的擴散過程來生成輸出。該模型在三個階段進行了訓練:第一階段通過將Siglip2的視覺特徵映射到Llada的語言空間中,將視覺和語言嵌入對齊。第二階段使用1000萬個單像樣品和200萬個猛mm象VL的多模式樣品進行微型調節。第三階段的重點是使用VisualWebinstruct和混合數據集策略的900K QA對。雙向注意提高了環境理解,從而實現了強大的多模式理解。 在跨18個多模式任務的評估中,LLADA-V與混合自迴旋擴散和純粹基於擴散的模型相比表現出了出色的性能。在大多數多學科知識和數學推理任務(例如MMMU,MMMU-PRO和MMSTAR)上,它的表現優於Llama3-V,儘管使用LLADA-V使用LLADA-V,但在MMSTAR上取得了60.1的得分,但使用LLADA-V較弱的LLADA-8B語言。 LLADA-V在數據效率方面也表現出色,在MMMU-PRO上的表現優於Llama3-V,對Llama3-V的900萬樣本的表現優於MMMU-PRO。儘管它滯後於圖表和文檔理解基準,例如AI2D和現實世界的場景任務,例如Realworldqa,但LLADA-V的結果卻突出了其對多模式任務的希望。 總而言之,LLADA-V通過引入純粹基於擴散的架構將視覺指導調整與掩蓋擴散結合的純粹基於擴散的體系結構來解決有效的多模型的挑戰。該方法在保持數據效率的同時提供了強大的多模式推理能力。這項工作證明了在多模式AI中擴散模型的潛力,為進一步探索複雜AI任務的概率方法鋪平了道路。 查看紙張和GitHub頁面 。 這項研究的所有信用都歸該項目的研究人員。另外,請隨時關注我們 嘰嘰喳喳 而且不要忘記加入我們的 95k+ ml子雷迪特 並訂閱

Scroll to Top