3D 機器學習課程文件

網格生成

Hugging Face's logo
加入 Hugging Face 社群

並獲得增強的文件體驗

開始使用

網格生成

新的解決方案已經出現,它們解決了行進立方體的侷限性,允許將密集網格轉換為低多邊形網格。

在本課程早期,我們強調了可微性的重要性,以及網格渲染如何是不可微的,涉及離散決策,例如

  • 這個畫素在三角形內部嗎?

雖然這仍然是事實,但新的研究透過將網格三角形視為離散符號,類似於語言模型中的詞,引入了一種可微的網格生成方法。

MeshAnything

MeshAnything 是一個最近的研究專案,它使用 MeshGPT 中引入的技術將密集網格轉換為低多邊形網格。

MeshAnything 的主要組成部分是

  1. VQ-VAE 編碼器:使用向量量化 (VQ) 變分自編碼器 (VAE) 將密集 3D 資料編碼為離散潛在表示。
  2. 自迴歸 Transformer 解碼器:使用自迴歸 Transformer 解碼器生成網格的三角形。

更多詳情可在論文 MeshAnything: Artist-Created Mesh Generation with Autoregressive Transformers 中找到。

MeshAnything Demo

影響

MeshAnything 代表了 3D 網格生成領域的一大步,解決了阻礙實用生成式 3D 工具發展的一個主要瓶頸。

然而,目前的結果與傳統的拓撲簡化方法(如 Decimate)相比仍相形見絀,甚至更差,仍然需要大量的手動細化。

可微網格生成為上下文感知的拓撲簡化打開了大門,即考慮形狀和變形。雖然仍在進行中,但解決這個問題將帶來高度實用的 3D 工具。

< > 在 GitHub 上更新

© . This site is unofficial and not affiliated with Hugging Face, Inc.