用戶友好的系統可以幫助開發人員構建更有效的模擬和AI模型|麻省理工學院新聞
在醫學圖像處理和語音識別等應用程序中使用的神經網絡人工智能模型對需要大量計算進行處理的非常複雜的數據結構進行操作。這是深度學習模型消耗大量能量的原因之一。 為了提高AI模型的效率,麻省理工學院的研究人員創建了一個自動化系統,該系統使深度學習算法的開發人員能夠同時利用兩種類型的數據冗餘。這減少了機器學習操作所需的計算,帶寬和內存存儲的量。 現有用於優化算法的技術可能很麻煩,通常只允許開發人員利用稀疏性或對稱性 – 深度學習數據結構中存在的兩種不同類型的冗餘。 通過使開發人員能夠立即利用兩種冗餘的算法構建算法,麻省理工學院研究人員的方法在某些實驗中使計算速度提高了近30倍。 由於系統使用用戶友好的編程語言,因此可以為廣泛的應用程序優化機器學習算法。該系統還可以幫助那些不是深度學習專家但希望提高其用於處理數據的AI算法的效率的科學家。此外,該系統可以在科學計算中應用。 “很長一段時間以來,捕獲這些數據冗餘需要大量的實施工作。取而代之的是,科學家可以告訴我們的系統他們想以更抽象的方式計算什麼,而不告訴系統如何計算它。”將在國際代碼生成和優化研討會上介紹。 首席作者Radha Patel ’23,SM ’24和高級作家Saman Amarasinghe加入了她的參考書,電氣工程與計算機科學系教授(EEC)和計算機科學和人工智能實驗室的首席研究員(EECS)(EECS)( EECS)(EECS)加入了她的參考。 CSAIL)。 削減計算 在機器學習中,數據通常表示並操縱為多維陣列,稱為張量。張量就像一個矩陣,它是在兩個軸,行和列上排列的值的矩形陣列。但是,與二維矩陣不同,張量可以具有許多尺寸或軸,從而使張量更難操縱。 深度學習模型使用重複的矩陣乘法和添加對張量進行操作 – 此過程是神經網絡在數據中學習複雜模式的方式。在這些多維數據結構上必須執行的龐大計算需要大量的計算和能量。 […]