OmniSVG: テキストと画像からSVGベクターグラフィックスを生成するオープンソースプロジェクト
概論 OmniSVGは、マルチモーダルモデルによる高品質なベクターグラフィックス(SVG)の生成に特化したオープンソースプロジェクトである。事前に訓練された視覚言語モデルを使用して、テキスト記述や画像入力からのSVG生成をサポートし、単純なアイコンから複雑なアニメキャラクターまで幅広いシナリオをカバーします。アイテム ...
Napkins.dev:ワイヤーフレームをアップロードしてLlama4ベースのフロントエンドコードを生成する
一般的な紹介 Napkins.devはフリーのオープンソースプロジェクトです。コア機能は、ユーザーがインターフェイスのスクリーンショットやワイヤーフレームをアップロードして、実行可能なフロントエンドコードを自動的に生成できるようにすることです。ユーザーはデザイン画を提供するだけでよく、ツールはLlama 4モデル(by Together ...
EmemeAI: 3DバーチャルAIキャラクタの作成とエクスポートのためのインタラクティブプラットフォーム
概 要 EmemeAIは、3DのAIキャラクターを作成するためのプラットフォームです。VRM形式の3Dモデルをアップロードし、キャラクターの性格を設定することで、自動でチャットや動きができるバーチャルキャラクターを生成することができます。キャラクターは会話だけでなく、状況に応じて表情やアクションを生成することができます。
Agent-Wiz:AIインテリジェンシアのワークフローとセキュリティリスクの分析
概要 Agent-Wizは、開発者、研究者、セキュリティチーム向けに設計されたオープンソースのPythonコマンドラインツールです。LangGraph、CrewAI、AutoGenなどの主要なAIインテリジェンスフレームワークから複雑なワークフローを抽出し、...
Orion:シャオミのオープンソースのエンド・ツー・エンドの自動運転推論・計画フレームワーク
包括的な紹介 OrionはXiaomi Labsによって開発されたオープンソースプロジェクトで、エンドツーエンド(E2E)自律走行技術に焦点を当てています。Orionは、視覚言語モデリング(VLM)と生成プランナーによって、従来の自律走行手法の複雑なシナリオにおける因果推論が不十分であるという問題を解決する。
ReCamMaster: 1つのビデオからマルチビュービデオを生成するレンダリングツール
一般的な紹介 ReCamMasterはオープンソースのビデオ処理ツールで、コア機能は1つのビデオから新しいカメラビューを生成することです。ユーザーはカメラ軌道を指定し、ビデオを再レンダリングすることで、異なるアングルのダイナミックな画像を得ることができます。ReCamMasterは、浙江大学とRacer Technologyのチームによって開発されました。
BrowseComp:OpenAI、AIネットワークの情報検索能力を評価する新しいベンチマークを発表
最近、OpenAIは、インターネットをナビゲートするAIエージェントの能力を評価するために設計されたBrowseCompと呼ばれる新しいベンチマークテストをリリースした。このベンチマークは、科学的発見からポップカルチャーまで幅広い領域をカバーする1,266の問題で構成され、エージェントに...
WiseBIM AI: 2D建築図面を3D BIMモデルに高速変換
包括的な紹介 WiseBIM AIは、AIベースのRevitプラグインで、2Dの建築図面を3DのBIMモデルに素早く変換することに重点を置いています。フランスのWiseBIM SAS社によって開発され、図面内の壁、ドア、窓、床スラブなどの要素を自動的に認識し、BIMモデルを生成します。
SimplAI:インテリジェントなAIアプリケーションを迅速に構築する企業向けプラットフォーム
概要 SimplAIは、セキュアなAIエージェントと自動ワークフローを迅速に構築、導入、管理できるよう、企業向けに設計されたプラットフォームです。使いやすいツールであるSimplAI Studioを提供し、チームがA...
Tarsier: 高品質な動画説明を生成するためのオープンソース動画理解モデル
包括的な紹介 Tarsierは、ByteDanceによって開発されたオープンソースのビデオ言語モデルファミリーで、高品質のビデオ記述を生成するためのものです。CLIP-ViTがビデオフレームを処理し、Large Language Model (LLM)が...