その他

【Devin】開発現場でじわじわ浸透中のAIエージェント

その他
この記事は約11分で読めます。

はじめに

みなさんこんにちは!
最近はAIエンジニアブームがすごいですよね。その中でも、特に注目を浴びているのがDevinです。さまざまな記事サイトを見ていると、さまざまな会社さんで導入されているのがわかります。

Devin
Devin is an AI coding agent and software engineer that helps developers build better software faster. Parallel cloud agents for serious engineering teams.

そんな中で、弊社でも導入が進んでおり、普及に向けた取り組みが行われています。

いまさら!にはなってしまうかもしれませんが、Devinの概要やできることについて、2025年6月現在のバージョンとして、Devinでできることをまとめていこうと思います。

Devinって何?

Devinは、2024年3月12日に、世界初のフル自立型AIソフトウェアエンジニアとして初公開されました。自立型、ということもあって、他のAIとは一味も二味も違います。例えば、chatGPTは質問したらコードを提示してくれますが、Devinは自分でコードを書き換えてしまします。cursorは質問したらコードを書き換えてくれますが、Devinは自分で変更したコードのテストまで実施してしまいます。
つまり、人間のやることは依頼することと、終わった作業結果を確認すること、それだけなのです。

アメリカのサンフランシスコに本拠地を置くスタートアップ Cognition(Cognition Lab, Inc.)が開発しました。創業は2023年11月で、創業者にはScott Wu(CEO)Steven Hao(CTO)Walden Yan(CPO)などのメンバーがいます。

2025年6月現在、Devinはバージョン2.1になります。5月15日に出たばかりのバージョンです。2.1になって大きな変化はありませんが、細かな変化もあるので、その点についても説明していきます!

Cognition | Devin 2.1
We’re announcing some major changes in Devin 2.1. Devin now reports its confidence that it can complete tasks using 🟢 🟡 🔴 and is more likely to succeed in large...

Devinのできること

ソフトウェア開発全般の作業

我々が使うような日本語を通して、計画からコーディング、テスト実行とレビュー、PR作成までを全て自動でやってくれます。開発で行う工程のほとんどを自立して実行することができるのです。

試しに、todoリストを作って欲しいと頼んでみましょう。
GitHubとも連携ができ、issueを通して依頼したい作業を送ることもできます。開発工程が複雑だったり、ワンポイントごとに開発を進めたい人は、この方法がいいかもしれません。issueのリンクを添付して、todoリストを作って欲しいとDevinへ依頼します。

すると、自分でブラウザを開き、issueを確認し(404エラーで弾かれたりしながら笑)、todoリストを作り始めました。初めてDevinへ作業依頼させる人からすると、驚きの連続かと思います。続けて、ファイル作成やコーディングを、ターミナルなど駆使しながら作っていました。

しばらく待っていると、作業が完了したとPR作成までしてくれました。すごい!
作業内容を確認しましたが、完璧に出来上がっています。ものの10分程度でここまで作ってくれました。ここからちょっとカスタマイズを加えるよう指示し、最終的に消費されたACUは3.27でした。

完成された実物を見てみても、かなりしっかりとできています。
これをベースに自分でDevinの苦手なUIのアレンジを加えたり、Devinに指示を出して、さらに機能を追加してみてもいいかもしれませんね!

移行作業

Devinは、言語やフレームワークの移行作業も得意です。
言語の移行作業では、JavaScriptからTypeScriptのような簡単な言語移行もできますし、PythonからJavaScriptといった移行作業も可能です。

試しに、せっかく作ってもらったtodoリストの移行作業をしてもらいましょう。
Flaskベースでできているtodoリストですが、これをフロントをReactにしてもらいます。さて、どのように作業してくれるでしょうか。今回はissueを作らずチャットから直接指示を送りました。

指示を送ると、早速作業を始めてくれました。
そして、今回もしばらくするとPR作成まで完了していました。前回同様、10分程度で作業を終わらせていました。消費したACUは1.08です。

見た目も全く変わらず移行作業をしっかりとやってくれました。素晴らしい!

バグ修正や管理・検索も

Devinでは、他のAI(cursorやchatGPTなど)ができるようなバグ修正も、もちろんできます。また、テストCI/CD対応など、コードがかかわることであれば、基本的になんでもできてしまいます。

以前の記事で、ゴミ出しLMというのを作ったことがあります。
実はここでも、ゴミ出しの情報がうまく回収してくることができず、最後の手段としてDevinに修正を依頼しました。すると、約2.5ACUで問題箇所を見つけ、ちゃんと動作するようになりました。ほんと、天才です。(特に記事でフォーカスして書いてはいませんが、よければご覧ください!)

さらに、Devin Wikiと呼ばれる機能もついており、プロジェクトのコードベースを自動で解析・インデックス化し、アーキテクチャ図や機能間のリンク付きドキュメントを生成することができます。某サイトのように、リポジトリー内のコードについて、READMEのような形で説明があります。

さらにさらに、Ask Devin Devin Search(記事を作っているここ数日(2025/06現在)で改名されました笑)と呼ばれる機能では、日本語でコードについて調べたい箇所を聞くと、関連するコードやドキュメントを即座に提示してくれるツールです。特定のリポジトリーを選択して、それについて詳しく聞くこともできます。

ちなみに、このDevin wikiAsk Dvinに関しては、ACUを消費せずに使用することができます。Devinが書いたコードの詳しい意図やファイル配置などはもちろん、他の人が書いたコードについても調べることができるのです。

このように、非常に便利な動作やツールを駆使することができるのが、Devinというわけです!

ツール連携もできる

Devinは、他のツールとも連携ができます。

GitHubでは、コードベースの読み取りや変更後のPR作成で役立ちます。
まず、連携しない人はいないだろうというのがこのツールです。(というか、連携しないと使えないだろ!と思いますが)リポジトリをクローンしてコードの変更を加えてくれます。変更後は、テストなどを実行し、PR作成で変更内容や理由を説明もしてくれます。PRが通るまでこれを繰り返してくれるので、すごいですよね。

GitHub Japan
GitHubはソフトウェア開発のプラットフォームです。GitHubには8000万件以上ものプロジェクトがホスティングされており、2700万人以上のユーザーがプロジェクトを探したり、フォークしたり、コントリビュートしたりしています。

Slackでは、Devinとのコミュニケーションで役立ちます。
これは連携しなくても使えますが、連携した方が作業効率は格段に上がります。どのようなシーンで役立つかというと、例えば外出先でDevinからの作業報告を受け取ったり、受け付けたりしてくれます。少し重たい作業を任せた時は、Devinからの確認のメッセージもあるので、それに対して即座に反応できるようになるのが強みですね。

AI による業務管理とプロダクティビティツール
その仕事、Slack で。人、プロジェクト、ツール、AI を一元化した、世界で最も愛される、ビジネスの基本ソフトです。

Linearでは、issue管理に役立ちます。
Linearのチケット(issue)と、Devinの作業タスクが自動で同期されます。Devinがチケットを引き受けて処理し、完了まで移行させてくれます。やらなければいけない(開発しなければいけない)issueを可視化した後は、Devinが後は全て引き受けてくれるというわけですね。もちろん、Devinはデザインなど主観にかかわるタスクは苦手なので、そのようなタスクは後回しにしますから、そこは自分で頑張りましょう笑。

Linear – Plan and build products
Linear streamlines issues, projects, and roadmaps. Purpose-built for modern product development.

その他、役立ちそうな連携できるツールをchatGPTがまとめてくれました。よければ参考にしてみてください。

ツール内容/活用例
Notion / ConfluenceDevin Wikiと統合して社内文書を構造化する用途
Sentry / Datadogバグや異常の自動検出→Issue化→Devinによる修正ワークフロー
CI/CD (GitHub Actions, CircleCIなど)PR作成後のテスト結果を確認し、必要なら修正も自動実行

Devinが苦手・できないこと・限界

タスクが100%できるわけではない

Devinは、コードに関してなんでも対応できるわけではありません。

タスクを開始する時にDevin は、🟢 🟡 🔴 を使用してタスクを完了できるという信頼性を報告します。これは、今回のバージョンアップ(Dvin 2.1)からの機能だそうです。
🟢 から順に、自信がある、完了できるという信頼度を3段階で示します。信頼スコアはタスクの成功と高い相関関係があり、🟢 スコアの場合は 🔴 スコアの場合よりもマージされた PR の可能性が 2 倍になるそうです。

また、Devinは汎用的な開発エージェントであるため、特定の業界に特化した設計判断は苦手です。例えば、金融や医療、法律など、規則やその業界の習慣を考慮した設計は苦手です。

自立型といっても、完全に全てを判断してタスクを遂行することは、まだできないのです。

画像や映像などの視覚的なタスクや、非構造化されたタスク

Devinは視覚的なことにかかわるタスクは苦手です。

UI設計やデザインレビューなどは弱いです。もちろん、簡単なUI設計はできます(todoリストのように)が、視覚的に使いやすいUIや、目的を達成するためにUX(顧客体験)を重視したUIにして欲しい、などのリクエストは苦手です。

また、曖昧なタスクも苦手です。情報を与えて、「いい感じにして」や「最適化して」などの要求に対しては、Devinは慎重になります。仕様を明確にしないと、事前にDevinがたくさん質問してきますので、アイデアを考えさせることはやめておきましょう。

例えば、Devinに色変更タスクを渡してみましょう。
先ほど作ってもらったtodoリストは暗めの色だったので、もう少し明るい青にしてもらいます。それとなく雑な指令を出してみました。

その後、作業を始めてはくれたものの、思ったとおりの青色にならず、なかなか苦戦しました。最終的に、3回ほど繰り返し、デザイン修正(色の変更)だけ2.12ACUでした・・・。これはちょっとコスパが良くないですね。

今回はtodoリストですので、デザインの中でも簡単に取り組めたかもしれませんが、もう少し複雑なUIは難しいかもしれません。簡単な色変更程度で、もしメインカラーが決まっているのであれば、そのカラーコードを提示するのがいいでしょう。

Devinは基本的に、コードベースや自然言語を処理対象としていることを忘れないようにしましょう。

長時間の仕事

Devinは大きなタスク(長い時間かかるタスク)は苦手です。

Devinももちろん記憶能力などありますが、数日間にまたがるタスクや、途中で中断される作業には、再度始めて欲しいと依頼しても、復帰まで時間がかかる場合があります。そのため、先ほど紹介したissue管理ツールやGitHubのissueで、ポイントごとに細かく区切れるようなタスクを用意したり、中間地点を定めてタスクをさせることが大事です。

ちょっと話はずれますが、「自己紹介のサイトを作りたいなぁ・・・」と、何気ないぼんやりとした指示を与えます。
これに対して、Devinは生粋のプログラマー気質なので、もらった仕事をなんとかこなそうと、勝手に仕事を始めてしまいます。しかし、ぼんやりとした指示なので、考えながら作ってしまうことで、余計にACUを消費してしまったり、書き換えてはいけないリポジトリーを勝手に書き換えてしまう事故も起きてしまいます。(赤い部分が削除された場所)

そんな事故を防ぐためにも、詳しいこまめなタスクを作りを心がけましょう。長時間のタスクはACUもたくさん消費してしまうので、無理をさせないようにしましょう。

チームで使用する際の注意点

DevinにはACUという活動限界があります。

これはDevinの限界とは少し話がずれますが、チームでDevinを使用する際には、お互いにACUを使いすぎないよう、情報共有をしておくことが大事かもしれません。今の所、2人で1Devinを共有していましたが、本格的な運用ではないため、1ヶ月で250ACUすべてを使うことはありませんでした。

冒頭の実践でもお話ししたように、todoリスト3ACU前後ですので、小規模チーム(5人以上)であれば、よほどのことがない限り250ACUというのは消費しきれないと思います。ですが、1日の終わりや、1週間の最後にACUの残りを確認しておくことで、Devinに対して業務を依頼していいか、心の余裕が生まれる感じがありました。

もちろん、250ACUまでをしっかりと使うに越したことはないですが、オーバーしないためにも、1日の業務計画でどのくらいACUを消費するのか、見通しを持っておくことで、効果的なDevin運用ができるのではないか、と1ヶ月使用して感じました。

余談ですが、作業終わりのSLEEP指示を出す前に、ありがとう!! など一言そえたからか、ボーナスACUがもらえました。そんなこともあるんですね。人間味がありますね笑。

Devinのこれから

さて、そんなDevinですが、今後も更なる成長が期待されています。

先ほど紹介したDevinの苦手部分を補うよう、さらに自律しマルチエージェント化していくことが見込まれています。これにより、AI+人間というチームも社内で生まれる(生まれてる?)かもしれません。AIが下位レベルのコード作業を担い、人間エンジニアはよりプロダクトについて考え判断し、上流過程やUXに集中できるスタイルが生まれるかもしれません。

いずれにしろ、DevinのようなAIエージェントに対して、どのくらい細かく、詳細に指示をすべきかは、人間側が常に学習をしていかなければいけません。効率よく動かすためにも、指示のフェーズは特に大事です。今後もどのくらい細かくすべきなのかは、指示を出しながら研究を重ねていきたいと思います。

まだ完全自立になるのは早そうですが、今後の成長を見守りたいですね。

さいごに

ご覧いただき、ありがとうございました!

Devinを理解して正しく使えれば使うほど、生産効率は非常に高くなると思います。今後もたくさん使っていって記事にしていこうと思いますので、ぜひご覧ください。

せっかくなので、Devinが作ってくれたプログラムを共有します。このクオリティがつくれるんだ!の参考程度に、ご覧ください。

GitHub - iwasakiterukazuimpl/devin_todo_Flask
Contribute to iwasakiterukazuimpl/devin_todo_Flask development by creating an account on GitHub.
GitHub - iwasakiterukazuimpl/devin_todo_React
Contribute to iwasakiterukazuimpl/devin_todo_React development by creating an account on GitHub.