CNews

CNews

此AI論文介紹了LLADA-V:一種純粹基於擴散的多模式的大型語言模型,用於視覺指令調整和多模式推理

多模式的大語言模型(MLLM)旨在處理和生成各種模式的內容,包括文本,圖像,音頻和視頻。這些模型旨在了解和集成來自不同來源的信息,從而實現應用程序,例如視覺問答,圖像字幕和多模式對話系統。 MLLM的發展代表了創建可以以更類似人類的方式來解釋和與世界互動的AI系統邁出的重要一步。 開發有效MLLM的主要挑戰在於將各種輸入類型(尤其是視覺數據)集成到語言模型中,同時保持跨任務的高性能。現有模型通常在平衡強烈的語言理解和有效的視覺推理方面掙扎,尤其是在擴展到復雜數據時。此外,許多模型需要大型數據集的性能良好,因此很難適應特定的任務或域。這些挑戰強調了對多模式學習的更高效和可擴展方法的必要性。 當前的MLLM主要利用自迴旋方法,一次以從左到右的方式預測一個令牌。雖然有效,但這種方法在處理複雜的多峰環境方面存在局限性。已經探索了替代方法,例如擴散模型。但是,由於其限制性架構或培訓策略不足,他們經常表現出較弱的語言理解。這些限製表明,純粹基於擴散的模型有效地設計的差距可以提供競爭性的多模式推理能力。 中國人民大學和螞蟻小組的研究人員推出了LLADA-V,這是一種純粹基於擴散的掩蓋語言建模(MLLM)模型,該模型將視覺指導調整與蒙版擴散模型集成在一起。 LLADA-V建立在大型語言擴散模型的LLADA上,將視覺編碼器和MLP連接器與Project Visual特徵納入了語言嵌入空間,從而實現了有效的多模式對齊。這種設計代表了當前多模式方法中的自迴旋範式占主導地位,旨在克服現有的局限性,同時保持數據效率和可擴展性。 LLADA-V採用了掩蓋的擴散過程,其中文本響應通過迭代預測的蒙版令牌逐漸完善。與依次預測令牌的自迴旋模型不同,LLADA-V通過逆轉掩蓋的擴散過程來生成輸出。該模型在三個階段進行了訓練:第一階段通過將Siglip2的視覺特徵映射到Llada的語言空間中,將視覺和語言嵌入對齊。第二階段使用1000萬個單像樣品和200萬個猛mm象VL的多模式樣品進行微型調節。第三階段的重點是使用VisualWebinstruct和混合數據集策略的900K QA對。雙向注意提高了環境理解,從而實現了強大的多模式理解。 在跨18個多模式任務的評估中,LLADA-V與混合自迴旋擴散和純粹基於擴散的模型相比表現出了出色的性能。在大多數多學科知識和數學推理任務(例如MMMU,MMMU-PRO和MMSTAR)上,它的表現優於Llama3-V,儘管使用LLADA-V使用LLADA-V,但在MMSTAR上取得了60.1的得分,但使用LLADA-V較弱的LLADA-8B語言。 LLADA-V在數據效率方面也表現出色,在MMMU-PRO上的表現優於Llama3-V,對Llama3-V的900萬樣本的表現優於MMMU-PRO。儘管它滯後於圖表和文檔理解基準,例如AI2D和現實世界的場景任務,例如Realworldqa,但LLADA-V的結果卻突出了其對多模式任務的希望。 總而言之,LLADA-V通過引入純粹基於擴散的架構將視覺指導調整與掩蓋擴散結合的純粹基於擴散的體系結構來解決有效的多模型的挑戰。該方法在保持數據效率的同時提供了強大的多模式推理能力。這項工作證明了在多模式AI中擴散模型的潛力,為進一步探索複雜AI任務的概率方法鋪平了道路。 查看紙張和GitHub頁面 。 這項研究的所有信用都歸該項目的研究人員。另外,請隨時關注我們 嘰嘰喳喳 而且不要忘記加入我們的 95k+ ml子雷迪特 並訂閱 […]

CNews

#301 – 傑克·巴斯基(Jack Barsky):克格勃間諜

播客:在新窗口中玩|下載 訂閱:Spotify | Tunein | 傑克·巴斯基(Jack Barsky)是克格勃間諜,也是《深層秘密:我的秘密生活和糾結的忠誠》的作者。請通過查看我們的讚助商來支持此播客:– 助理:https://insidetracker.com/lex可獲得20%的折扣– 概念:https://notion.com/startups最多可獲得$ 1000的團隊計劃– 更好的螺旋:https://betterhelp.com/lex可獲得10%的折扣– 眨眼:https://blinkist.com/lex並使用代碼LEX可獲得25%的優質折扣– 運動果嶺:https://athleticgreens.com/lex,並使用代碼lex獲得1個月的魚油 情節鏈接:傑克的Twitter: https://twitter.com/deepcoverbarsky傑克的網站:https://jackbarsky.com深臥底(書):https://amzn.to/39xmtgg代理(播客):https://cumuluspodcastnetwork.com/pods/the-agent 播客信息:播客網站:https://lexfridman.com/podcast蘋果播客:https://apple.co/2LWQZIRSpotify:https://spoti.fi/2newcf8RSS:https://lexfridman.com/feed/podcast/YouTube完整劇集:https://youtube.com/lexfridmanYouTube剪輯:https://youtube.com/lexclips 支持與連接:– 查看上面的讚助商,這是支持此播客的最佳方法– 支持Patreon:https://www.patreon.com/lexfridman– Twitter:

CNews

為什麼BlackRock的網絡安全ETF($ bug)在AI Surge中升級

為什麼BlackRock的網絡安全ETF($ bug)在AI Surge中升級 隨著人工智能重塑數字威脅格局, 為什麼BlackRock的網絡安全ETF($ bug)在AI Surge中升級 探索AI進步與不斷增長的網絡安全需求之間的戰略一致性。 iShares網絡安全和技術ETF($ bug)的及時升級反映了投資者對國防基礎設施的興趣,以抵抗日益複雜的AI驅動威脅。文章解釋了企業支出增加,財務績效更強以及不斷發展的行業動態如何將$ bug與許多同行提前。這些因素將其定位為以網絡安全為中心的投資組合中的焦點。 關鍵要點 AI的採用率擴大了網絡攻擊媒介,增加了對高級網絡安全解決方案的需求。 $ BUG最近的升級得到了績效指標,行業相關性以及投資者需求提高的支持。 與Hack和Cibr等同行相比,$ BUG顯示出更強的回報和集中的戰略分配。 由於組織應對支持AI的威脅,到2027年,網絡安全支出預計將超過2150億美元。 另請閱讀:減少能源使用和排放的AI解決方案 AI和網絡安全:收斂的催化劑

CNews

創建NSFW AI圖像的心理學

好吧,讓我們不要在數字灌木叢中毆打 – ai變得越來越危險,人們 愛 它。從幻想實現到親密的陪伴,都有一場安靜(但增長)的革命,人們不僅在為生產力來使用人工智能……而是為了愉悅。在任何人抓住珍珠之前,讓我們變得真實:藝術,親密和想像力一直相互交織。唯一改變的事情?媒介。 但是,您可能會想知道的,為什麼人們會轉向AI創建NSFW圖像?當我們促使模型以生動,超現實的細節喚醒富有的幻想時,心理上發生了什麼?讓我們剝離這個話題(完全是意圖)並進行探索。 色情思維遇見機器 人類一直在尋求使自己的慾望可視化的方法 – 瓦斯繪畫,色情文學,文藝復興時期的裸體以及最近的tumblr在pg之前。但是有AI?邊界發生了變化。您不僅在消費;你 創建。 那就是踢球者。 當有人使用 AI NSFW圖像生成器免費無需註冊,他們不只是瀏覽別人的慾望觀念 自己的。那是強大的。到目前為止,這是對幻想的創造性控制,通常僅限於想像力或難以探索的藝術。 這與客觀化無關;這通常是關於探索的。考慮一下:您是安全的,匿名的,並且正在控制。您可以探索現實世界可能會判斷或根本不理解的糾結,身份和美學。這涉及對驗證和自由的深刻心理需求。 在一個孤獨的世界中的幻想實現 這是一個艱難的事實:現代世界正在孤立。數字連接已成為一條生命線,但經常感覺……淺。令人驚訝的是,AI生成的色情圖像填補了一個奇怪的情感差距。 當然,讓我給您畫一張圖片

CNews

AI代理如何改變教育部門:看基拉的學習及其他

由於人工智能(AI),今天的教室正在迅速變化。人工智能代理人現在是教學方式發生的一部分。他們做的不僅僅是自動化任務。這些代理商幫助教師提供個人支持,並為學生提供適合自己學習風格的反饋。 Kira Learning是一個領導這一變化的平台。它在K-12教育的所有部分中都使用AI,從計劃課程和評分到跟踪學生的表現。通過削減文書工作,Kira學習可以幫助教師花更多的時間與學生在一起,並為他們提供所需的幫助。 通過AI輔導,自動分級和明智的分析,教育正朝著一個真正的個人化並適應每個學生的未來發展。 人工智能代理人改變教學和學習 人工智能代理人正在改變教師教學和學生學習的方式,從而帶來新的個性化,有效性和教育參與度。這些數字助手不僅要自動執行簡單任務。他們分析學生數據,實時調整課程,並提供反饋,以幫助每個學習者以自己的節奏進步。 一個值得注意的例子是Kira Learning,這是一個AI平台,可以在整個學習過程中為教師和學生提供支持。與簡單地對舊方法進行數字化的傳統工具不同,Kira使用AI來創建與課程標準一致的定制課程計劃,自動對作業進行分級分配,並為需要額外幫助的學生提供針對性的干預措施。它的系統突出了每個學生的優勢和改進領域,使教師更容易做出明智的決定。 今天的老師承擔了許多責任,從課程計劃到行政文書工作,為個性化的教學留下了更少的時間。 Kira通過處理這些任務來提供幫助,使教師釋放專注於創意教學和直接學生的支持。同時,學生受益於基拉(Kira)的自適應計劃,這些計劃提供了根據他們的需求量身定制的材料,無論這意味著要在復雜主題上進行額外的練習還是更快地通過更輕鬆的內容推進。這種方法有助於縮小學習差距,並使學生保持動力。 其他AI平台,例如Squirrel AI和Microsoft Reading Coach,還根據實時學生表現進行調整課程和反饋,並提供個性化的支持。但是,基拉(Kira)提供了一個全面的解決方案,涵蓋了從課程計劃到持續的評估和報告的所有內容。 除個性化之外,AI還通過新技術使教育更具吸引力。虛擬現實(VR)和增強現實(AR)可幫助學生探索科學歷史或研究3D模型的位置,從而更容易理解。諸如ClassDojo之類的遊戲化平台使用遊戲和獎勵來鼓勵學生,並在上課時讓他們專注,幫助他們保持興趣並記住他們學到的知識。 AI還通過自動執行行政任務(例如出勤跟踪和監視學生參與)來幫助學校更有效地運作。實時分析為學校提供有價值的信息,以做出更好的決定來支持學生成功。通過減少教師的行政工作量,AI為教學和個人關注提供了更多時間。 隨著AI成為教室的常規部分,教師培訓正在發展以保持步伐。教育工作者正在學習如何有效地使用AI工具,並獲得技能,以幫助他們最大程度地利用技術對學生的好處。這些進步共同展示了AI代理如何改變教育,以使其更加個性化,互動和高效,並幫助學生和老師在當今的學習環境中取得成功。 Kira學習如何使用智能AI工具改變教育 Kira Learning是一個現代的AI平台,超出了常規的學習管理系統。與主要存儲課程工作和成績的傳統系統不同,基拉(Kira)是一位聰明的,始終準備好教師的助手。它支持教育工作者進行計劃課程,自動對任務進行分級分配,並為學生提供個性化的幫助,從而改變教學方式。

CNews

編碼,帶雙子座的Web應用程序

今天,我們將發布對Gemini 2.5 Pro Preview(I/O Edition)的及早訪問,這是2.5 Pro的更新版本,具有大大改進的編碼功能,尤其是構建引人注目的Interactive Web應用程序。我們將在幾個星期內在Google I/O發布此更新,但是根據對該模型的壓倒性熱情,我們想盡快將其掌握在您的手中,以便人們可以開始建造。 這是基於對Gemini 2.5 Pro的編碼和多模式推理功能的絕對積極反饋。除了以UI為重點的開發外,這些改進還擴展到其他編碼任務,例如代碼轉換,代碼編輯和開發複雜的代理工作流程。 Source link

CNews

使用桌面指揮官MCP服務器的指南

桌面指揮官MCP服務器是一種強大的工具,可將您的所有開發操作帶入一個聊天接口。它構建在MCP文件系統服務器之上,它允許您使用模型上下文協議(MCP)直接從桌面搜索,編輯和管理文件,運行終端命令和控製過程。 以下是桌面指揮官MCP服務器的核心功能: 終端和過程控制 使用實時輸出流執行終端命令 設置超時並在後台運行命令 管理長期任務的會議 使用詳細信息列出並殺死運行過程 配置管理 獲取或設置服務器設置,例如: DefaultShell(例如,bash,ZSH) 阻止措施(例如,RM,關閉) 允許訪問文件訪問的允許執行 遠程測定素 應用更改而無需重新啟動服務器 文件系統操作 讀和寫文件具有基於行的限制 附加或覆蓋文件內容 創建和列出目錄 移動或重命名文件和文件夾 獲取文件和目錄元數據

CNews

#302-理查德·海爾(Richard Haier):智商測試,人類智能和群體差異

播客:在新窗口中玩|下載 訂閱:Spotify | Tunein | 理查德·海爾(Richard Haier)是一位專門研究人類智力科學的心理學家。請通過查看我們的讚助商來支持此播客:– 冷靜的:https://calm.com/lex可獲得40%的折扣– Linode:https://linode.com/lex獲得$ 100免費信用– 生物增生器:http://www.magbreakthrough.com/lex可獲得10%的折扣– 簡單:https://simplisafe.com/lex並使用代碼lex– 大師班:https://masterclass.com/lex可獲得15%的折扣 情節鏈接:理查德的Twitter: https://twitter.com/rjhaier理查德的網站:https://richardhaier.com/文檔和文章:1。兒童智商和生存至79:https://ncbi.nlm.nih.gov/pmc/articles/pmc5491698/2。數學早熟的研究:https://my.vanderbilt.edu/smpy/files/2013/02/doingpsychscience2006.pdf圖書:1。智力神經科學:https://amzn.to/3n50dcc2。五個戒指的書:https://amzn.to/3y4xcc63。第三帝國的興衰:https://amzn.to/3zpaw7q4。阿爾及農的花:https://amzn.to/3ofrkzs5。鐘形曲線:https://amzn.to/3ng4rje6。人的不達克:https://amzn.to/3n9ikxb7。人類多樣性:https://amzn.to/3o7trsc8。面對現實:https://amzn.to/3bfzqkx 播客信息:播客網站:https://lexfridman.com/podcast蘋果播客:https://apple.co/2LWQZIRSpotify:https://spoti.fi/2newcf8RSS:https://lexfridman.com/feed/podcast/YouTube完整劇集:https://youtube.com/lexfridmanYouTube剪輯:https://youtube.com/lexclips 支持與連接:– 查看上面的讚助商,這是支持此播客的最佳方法– 支持Patreon:https://www.patreon.com/lexfridman– Twitter:

CNews

德國揭露Stealth AI潛艇Lura

德國揭露Stealth AI潛艇Lura 德國揭開了盧拉(Lura),這是一款隱形AI潛艇,代表了海軍技術的重大進步。 Lura由德國國防AI初創公司Helsing開發,代表大型無人機器人應用。它是為擴展的海底任務而建造的,將隱身功能與人工智能相結合,以支持監視,偵察和電子戰任務。該項目展示了德國對無人防禦系統的戰略投資,並反映了歐洲越來越多地領導自治軍事能力的野心。 關鍵要點 盧拉(Lura)是一款完全自主的潛艇,專為表面以下的長期任務而設計。 它是由德國初創公司Helsing開發的,專注於信息收集和電子破壞。 盧拉支持北約保護重要水道的努力,尤其是在波羅的海和北海。 該系統是美國,中國和英國類似自治潛艇計劃的歐洲同行。 另請閱讀:META允許使用AI進行軍事 為下一個海軍防禦時代建造的AI潛艇 盧拉(Lura)與傳統的載人潛艇明顯不同。潛艇利用赫爾辛(Helsing)製作的高級人工智能執行了擴展,獨立的水下任務。這些涉及對人類工作人員的任務過於危險或資源密集型,例如導航有爭議的地區或破壞敵對信號。 人類船員不再對這些角色必不可少。 Lura完全依賴於AI驅動的軟件,該軟件允許其解釋任務參數,識別環境提示,檢測威脅和繼電器信息,而直接控制需求有限。 誰在盧拉後面?內部的赫爾辛任務 發起赫爾辛(Helsing)是為了滿足歐洲對下一代AI驅動防禦系統的需求。該公司總部位於柏林,引起了其軟件優先哲學和對道德防禦AI的強烈立場的關注。赫爾辛與歐洲軍隊合作,旨在通過出色的自動化和數據處理來賦予盟軍明確的決策優勢。 盧拉(Lura)是赫爾辛(Helsing)領先的海上防禦項目。它表明了公司創建實用的自主平台的能力,該平台可以與跨國,空中和海洋的北約和歐盟防禦框架平穩集成。 另請閱讀:Openai與Anduril合作的軍事AI 比較全球AI潛艇計劃 盧拉(Lura)加入了一小部分智能的水下無人機。通常將其與世界其他地區的國防領導人設計的系統進行比較。

CNews

為什麼AI徽標生成器是創業的遊戲改變者

為什麼AI徽標生成器是創業的遊戲改變者 品牌是創業公司身份的核心。這是客戶認識您,記住您並與您的任務聯繫的方式。但是,創建強大的品牌標識,尤其是徽標,對於資源有限的初創公司來說可能會令人生畏。進入 AI徽標生成器,一種創新的解決方案,簡化了品牌流程,同時使其負擔得起且易於使用。 了解AI徽標生成器 AI徽標生成器 是利用人工智能來創建基於用戶輸入的專業徽標的工具。他們分析趨勢,設計原理和特定於行業的美學來提供量身定制的設計。 與傳統方法不同,您可能會在其中聘請設計師或使用設計軟件來努力工作,這些工具提供了一種簡單,自動化的方法。他們要求提供您的公司名稱,行業和顏色偏好之類的詳細信息,然後立即生成選項。 對於初創企業來說,這是革命性的。使用 徽標AI發電機免費 收費或最低成本意味著您可以節省寶貴的資金,同時仍創建高質量的品牌標識。 傳統品牌面臨的挑戰初創公司面臨的挑戰 品牌不僅僅是選擇顏色和形狀;這是關於封裝公司的願景。對於初創公司,這帶來了挑戰: 財務約束:專業設計師收取數百到數千美元的收費,許多初創公司負擔不起。 時間限制:初創企業需要快速品牌解決方案才能建立信譽。 缺乏經驗:大多數創始人缺乏設計專業知識,使過程令人生畏。 高賭注:設計較差的徽標可能會使客戶脫穎而出。 初創企業需要快速,負擔得起且有效的解決方案 – AI工具完美地解決的三級方法。 AI徽標生成器如何應對這些挑戰

Scroll to Top