XLSCOUT 釋出 ParaEmbed 2.0:一款在 Hugging Face 專家支援下專為專利和智慧財產權量身打造的強大嵌入模型

釋出於 2024 年 6 月 25 日
在 GitHub 上更新

本文是 XLSCOUT 團隊的客座博文。

XLSCOUT 是一家位於多倫多的公司,在智慧財產權 (IP) 領域的人工智慧應用方面處於領先地位。透過與 Hugging Face 的專家支援計劃開展的一項宏偉合作,該公司開發了一款名為 ParaEmbed 2.0 的強大專有嵌入模型。該合作專注於應用最先進的人工智慧技術和開源模型,以增進對複雜專利檔案的理解和分析,包括專利特定術語、上下文和關係。這使得 XLSCOUT 的產品能夠在撰寫專利申請、進行專利無效檢索以及確保創意相對於現有專利和文獻具有新穎性等方面提供最佳效能。

透過在由人類專家策劃的高質量、多領域專利資料上進行微調,ParaEmbed 2.0 的準確率比其前身 ParaEmbed 1.0(釋出於 2023 年 10 月)顯著提升了 23%。憑藉這一進步,ParaEmbed 2.0 現在能夠更精確地捕捉上下文,並將專利與現有技術、創意、產品或標準進行對映。

增強專利分析的征程

最初,XLSCOUT 探索使用專有 AI 模型進行專利分析,但發現這些閉源模型,如 GPT-4 和 text-embedding-ada-002,難以捕捉技術和專業化專利權利要求所需的細微上下文。

透過整合 BGE-base-v1.5、Llama 2 70B、Falcon 40B 和 Mixtral 8x7B 等開源模型,並在 Hugging Face 的指導下對專有專利資料進行微調,XLSCOUT 實現了更具針對性和高效能的解決方案。這一轉變使得對複雜技術概念和術語的理解更加準確,徹底改變了技術檔案和專利的分析與理解方式。

透過專家支援計劃與 Hugging Face 合作

與 Hugging Face 的合作對於提升 XLSCOUT 解決方案的質量和效能至關重要。以下是該合作伙伴關係如何演變及其影響的詳細概述:

  1. 初步開發與測試: XLSCOUT 最初在 Google Cloud Platform (GCP) 上構建並測試了一個自定義的 TorchServe 推理伺服器,該伺服器使用分散式資料並行 (DDP) 技術來服務多個副本。透過整合 ONNX 最佳化,他們實現了每秒約 300 個嵌入的效能速率。
  2. 透過微調增強模型效能: 使用由專利專家策劃的資料對嵌入模型進行微調。這個工作流程不僅能夠生成更精確和與上下文更相關的嵌入,還顯著提高了效能指標,確保在檢測相關現有技術時具有更高的準確性。
  3. 高吞吐量服務: 透過利用 Hugging Face 的 推理端點 (Inference Endpoints) 及其內建的負載均衡功能,XLSCOUT 現在使用 文字嵌入推理 (TEI) 來服務嵌入模型,以應對在生產環境中成功執行的高吞吐量用例。該解決方案現已實現令人印象深刻的效能,每秒可提供約 2700 個嵌入!
  4. 大語言模型 (LLM) 提示和推理: 合作內容包括圍繞 LLM 提示工程和推理的努力,這增強了模型生成準確且特定於上下文的專利草案的能力。提示工程被用於專利撰寫用例,確保提示能夠產生連貫、全面且法律上健全的專利檔案。
  5. 用指令資料微調大語言模型: 使用來自 Meta 和 Mistral 的模型實現了指令資料的格式化和微調。這種微調使得在專利撰寫過程的某些部分能夠生成更精確和詳細的內容,進一步提高了生成輸出的質量。

與 Hugging Face 的合作對 XLSCOUT 來說是一個改變遊戲規則的因素,顯著提高了其 LLM 驅動解決方案的處理速度、準確性和整體質量。這項合作確保了大學、律師事務所和其他客戶能夠受益於尖端的人工智慧技術,從而推動專利領域的效率和創新。

XLSCOUT 基於人工智慧的智慧財產權解決方案

XLSCOUT 提供最先進的人工智慧驅動解決方案,顯著提高專利相關流程的效率和準確性。他們的解決方案被企業、大學和律師事務所廣泛利用,以簡化智慧財產權工作流程的各個方面,從新穎性檢索和無效性研究到專利撰寫。

XLSCOUT Solutions

  • 新穎性檢查器 LLM (Novelty Checker LLM) 利用尖端的 LLM 和生成式 AI,快速瀏覽專利和非專利文獻以驗證您的創意。它提供一份全面的、經過排序的現有技術參考文獻列表,以及一份關鍵特徵分析報告。該工具使發明家、研究人員和專利專業人士能夠透過與大量現有文獻和專利進行比較,確保發明的創新性。
  • 無效宣告器 LLM (Invalidator LLM) 利用先進的 LLM 和生成式 AI,以極高的速度和準確性進行專利無效檢索。它提供一份詳細的、經過排序的現有技術參考文獻列表和一份關鍵特徵分析報告。這項服務對於律師事務所和企業高效挑戰和評估專利的有效性至關重要。
  • 撰寫助手 LLM (Drafting LLM) 是一個利用 LLM 和生成式 AI 強大功能的自動化專利申請撰寫平臺。它能在幾分鐘內生成精確且高質量的初步專利草案,包括全面的權利要求、摘要、附圖、背景和說明。該解決方案幫助專利從業者顯著減少撰寫詳細和精確專利申請所需的時間和精力。

企業和大學透過確保新穎的研究成果得到適當保護、鼓勵創新以及申請高質量專利而受益。律師事務所則利用 XLSCOUT 的解決方案為客戶提供卓越服務,從而提高其專利申請和訴訟工作的質量。

為創新而建立的合作伙伴關係

我們非常高興能與 Hugging Face 合作”,XLSCOUT 執行長 Sandeep Agarwal 先生說。“這次合作將 Hugging Face 無與倫比的開源模型、工具和團隊能力與我們在專利領域的深厚專業知識相結合。透過利用我們的專有資料對這些模型進行微調,我們有望徹底改變專利的撰寫、分析和許可方式。

XLSCOUT 和 Hugging Face 的共同努力涉及在 XLSCOUT 廣泛的專利資料收集上訓練開源模型。這種協同作用利用了 XLSCOUT 的專業知識和 Hugging Face 的先進 AI 能力,從而產生了專為專利研究最佳化的模型。使用者將受益於從複雜的專利檔案中得出的更明智的決策和寶貴的見解。

對創新的承諾和未來計劃

作為將人工智慧應用於智慧財產權領域的先驅,XLSCOUT 致力於探索人工智慧驅動創新的新前沿。這次合作標誌著在彌合尖端人工智慧與智慧財產權分析實際應用之間差距方面邁出了重要一步。

XLSCOUT 和 Hugging Face 正在共同為專利分析樹立新標準,推動創新,並塑造智慧財產權的未來。我們很高興能一起繼續這段精彩的旅程!

要為您的公司瞭解更多關於 Hugging Face 專家支援計劃的資訊,請在此與我們聯絡 - 我們的團隊將與您聯絡,討論您的需求!

社群

註冊登入 以發表評論

© . This site is unofficial and not affiliated with Hugging Face, Inc.