走向多模態:Prezi 如何利用 Hub 和專家支援計劃加速其機器學習路線圖
眾所周知,一張出色的視覺影像勝過千言萬語。視覺通訊軟體公司 Prezi 的團隊正在將這一理念付諸實踐,他們的 Prezi 簡報將影像和文字結合在高度動態的演示中。
Prezi 已加入 Hugging Face 專家支援計劃,以充分利用現代機器學習的潛力。在過去的幾個月裡,Hugging Face 支援 Prezi 將更小、更高效的開源模型整合到其機器學習工作流中。隨著多模態模型的能力日益增強,這項合作恰逢其時。
我們最近與 Prezi 的後端工程師 Máté Börcsök 坐下來,談論了他們參與 的經驗。在這段簡短的影片中,Máté 向我們介紹了他們的一些機器學習工作,並分享了他們透過專家支援計劃與我們團隊合作的經驗。
如果您想像 Máté 和他的團隊一樣,在我們的專家幫助下加速您的機器學習路線圖,請訪問
瞭解更多關於我們的專家支援計劃並索取報價。附帶額外細節的文字記錄:
介紹
我叫 Máté,是 Prezi 的一名後端工程師。Prezi 是一款能將您的想法變為現實的線上演示工具。
HF 專家支援計劃如何幫助您構建 AI?
我們在 Prezi 的旗艦 AI 產品是 Prezi AI,它能幫助我們的使用者更快地建立更好的 Prezi 簡報。使用者首先提供一個提示和他們想要建立的簡報的描述。然後系統會自動為他們建立一個簡報草稿。這是一個複雜的系統,它呼叫不同的服務,並使用閉源模型和各種素材提供商服務來構建簡報的結構。
當我們加入該計劃時,我們已經有了這個系統的一個版本,我們的專家審查了流程並提出了改進建議。我們的流程包括一個搜尋系統,為每個獨特的簡報找到合適的素材(影像和文字)。在這種情況下,一個重要的建議是,例如,在系統中新增一個開源的重排(re-ranker)模型,它可以比大型語言模型 (LLM) 更便宜、更快、更好地為您的簡報找到最佳的影像或文字。
我們的用例本質上是多模態的,因為我們的簡報結合了影像和文字。每週都有很多新模型釋出,我們的專家幫助我們撥開炒作的迷霧,瞭解哪些模型對我們有用,哪些沒有。這幫助我們節省了大量時間,因為我們正在使用視覺模型、文字模型和視覺語言模型 (VLM) 的組合來解決我們獨特的挑戰。多模態機器學習具有挑戰性,我們非常感謝得到的指導。我們不是機器學習工程師,我們正在一起學習成長的路上。
您最喜歡 Inference Endpoints 的哪個功能?
我強烈建議您檢視端點模型目錄。這是一個精選的模型列表,它們能與 Inference Endpoints 很好地配合,並且無需任何配置。我喜歡你可以設定端點在幾分鐘後進入休眠狀態,這樣就不會燒錢。它還支援某些模型所需的單核和四核 A100 例項。保持模型更新也非常簡單。Inference Endpoints 讓我們只需單擊一下即可部署最新版本,或使用 Git 雜湊回滾到任何舊版本。這些功能在 AWS 上都不容易獲得,所以使用它們對我們來說非常方便。即使某個模型還不在目錄中,讓它們工作也相對容易。至少在我們的專家支援下,對我來說是這樣。
哪些團隊能從專家支援中獲益最多?
與 Hugging Face 的合作關係為我們打開了機器學習的大門。我們的專屬專家讓我們能夠接觸到一個機器學習專家社群,他們可以對我們最大膽的問題給出反饋。正如我之前所說,我們不是機器學習工程師。我們的專家指導我們做正確的事情,分享嵌入、重排和物件檢測的最佳實踐和最先進的模型,並向我們展示如何微調新的視覺語言模型以及收集和整理資料。這些大多是我們自己可以做的事情,但他的指導極大地提高了我們的速度,並使我們能夠專注於為使用者完成有意義的任務。
透過專家支援計劃,我們組建了一支世界級的團隊,幫助客戶更快地構建更好的機器學習解決方案。我們的專家在您從研究到生產的機器學習旅程中,根據需要回答問題並找到解決方案。請訪問
瞭解更多資訊並索取報價。