Profile picture of 吉波拓夢 | DiningX CTO

吉波拓夢 | DiningX CTO

@yoshi8__

Published: March 17, 2025
2
33
360

自律型エージェントManusのオープンソース版「Open Manus」を触ってみたので、スレッドに残します↓

Image in tweet by 吉波拓夢 | DiningX CTO

OpenManusとは、2025年3月にMetaGPTチームによって開発されたオープンソースで、Manus AIの機能を再現することを目指しているプロジェクト https://github.com/mannaandpoe...

Image in tweet by 吉波拓夢 | DiningX CTO

「主要なエントリーポイント」 http://main.py: 安定版を実行するためのメインスクリプト run_flow.py: 不安定版を実行するためのスクリプト config/config.toml: LLM APIキーなどの設定ファイル 依存関係はrequirements.txtで管理され、インストールはCondaまたはuv(推奨)を使用する

Image in tweet by 吉波拓夢 | DiningX CTO

環境構築が終わったら、「python http://main.py」で実行 OpenManusが20ステップのタスクを順番に進めていく。 app.agent.base:run:139 - Executing step 1/20

Image in tweet by 吉波拓夢 | DiningX CTO

「ワークフローの理解」 ユーザーがタスクを提供すると、エージェントがLLMを使用してタスクを小さなステップに計画する。各ステップで適切なツールを選択し、実行。結果を観察し、次のステップを決定する。 このプロセスは、タスクが完了するまで繰り返される。例えば、「ステップ1: 20代女性に人気の化粧品についてリサーチ」では、「browser_use」が選択され、自動的にgoogle検索を行う。 ThinkとToolUseを掛け合わせて、タスクゴールに向かって自律的に処理する。

Image in tweet by 吉波拓夢 | DiningX CTO

「アーキテクチャ」 エージェント層: BaseAgent → ReActAgent → ToolCallAgent → Manus の階層構造。「思考(think)」と「行動(act)」のサイクルを実装し、ステップベースの実行ループと状態管理を実現。 フロー管理: BaseFlow → PlanningFlow でタスクを計画と実行に分解 タスクの進捗追跡と状態管理(未開始、進行中、完了、ブロック) LLM連携: OpenAI, Azure, Ollamaなど様々なLLMプロバイダに対応 ツール呼び出し機能を活用したインターフェース

「コア機能」 ・PythonExecute: Pythonコードを実行してシステム操作、データ処理、自動化タスクを実行 ・BrowserUseTool: ブラウザを操作しウェブインターフェースと対話 ・FileSaver: ローカルにファイルを保存(txt, py, htmlなど) ・Web検索機能: Google, Baidu, DuckDuckGoに対応

Image in tweet by 吉波拓夢 | DiningX CTO

Share this thread

Read on Twitter

View original thread

Navigate thread

1/7