その他

AIツールをカスタマイズして出力結果を調整してみよう

その他
この記事は約8分で読めます。

はじめに

こんにちは。

日々の業務で、ChatGPTをはじめとするAIツールを活用する機会が増えてきた方も多いのではないでしょうか。

一方で、「思ったような出力が得られない」「もう少し精度を上げたい」と感じた経験もあるかもしれません。

これまでにも、AIの出力を調整するためのシステムプロンプトに関する記事をいくつか公開してきました。

今回の内容はそれらと関連しつつ、より実践的に「AIツールをカスタマイズして出力を最適化する」方法を紹介していきます。

シシステムプロンプトに関する過去の記事は、以下のリンクからぜひご覧ください。

今回の目的

今回は、Microsoft CopilotChatGPT、そしてClaudeの3つのAIツールを対象に、
それぞれのカスタマイズ方法を試しながら、出力結果をどのように調整できるかを検証します。

Microsoft Copilot

Microsoft Copilotは、主にビジネス文書や資料作成を支援するAIツールです。

コーディング向けのツールではありませんが、日常業務では多くの人がWordやExcel、PowerPointなどのMicrosoft Officeアプリを使って資料を作成していると思いますので、取り上げることとしました。

Copilotの大きな特徴は、これらのOfficeアプリの中で直接AI機能を利用できる点です。

文章の下書き作成や要約、スライド構成の提案などを自然な操作感で行うことができます。

カスタマイズ

Microsoft Copilotのカスタマイズは、Web版のMicrosoft Copilotで行います。

左側のメニューバーから「エージェントの作成」を選択すると、カスタマイズ用の設定画面が表示されます。

今回の例では、Copilotの特性を踏まえ、資料作成を支援するエージェントとして設定しました。

たとえば、トーンや文体、出力形式(Markdownなど)を指定することで、より目的に沿った応答を得られるように調整しています。

名前:
週次報告資料作成

説明:
週次の業務報告資料をマークダウン形式で作成してください。

指示:
業務内容:
 ミッション1 : AI普及活動
 ミッション2 : 知財化
 ミッション3 : AIエージェント開発
 その他開発業務
 依頼などで、検証を兼ねた開発業務があります。
 詳細はユーザープロンプトを参照してください。
 次週の優先課題
 ナレッジを参照して、直近のタスクを示してください。
 リスク・課題
 業務内容から予想されるリスクや課題を提示してください。
 それによりユーザーが認識していない課題の発見が見込まれます。

ナレッジ:
参照したい情報(URL)

出力結果

設定した内容が反映されるかを確認するため、以下のプロンプトを入力してみました。

10/9の週次報告をまとめてください
ミッション1はramble作成
ミッション2は無し
ミッション3はAIエージェントの実装

その他業務は停止中

一度この内容を基に資料を作成してください

結果として、短いプロンプトであっても事前に定義した前提設定に基づき、Markdown形式の構造化された出力を生成することができました。

なお、Microsoft Copilotでは複数のカスタム設定を保存しておくことも可能で、タスクごとに異なるエージェントを用意することで、業務効率をさらに高めることができます。

ChatGPT

ChatGPTは、多様なタスクに柔軟に対応できる汎用的なAIツールです。

特に開発支援や文書作成、アイデア出しなど、幅広い用途で利用されています。

カスタマイズ

ChatGPTでは、課金プランに関係なく基本的なパーソナライズ設定を行うことができます。

設定画面の「パーソナライズ」メニューを開くと、プロフィールや作業スタイルを指定できる画面が表示されます。

僕の場合、業務で機械学習モデルやAIツールの開発を行うことが多いため、以下のような内容を設定しています。

これらをあらかじめ設定しておくことで、毎回環境を説明する手間が省け、出力精度と一貫性が向上します。

特にエンジニアの方は、使用ライブラリや環境情報を登録しておくことで、より自分の実装スタイルに沿ったコードディング結果を得られるかもしれません。

カスタム指示:
・情報に確信があることだけを出力する
・分からない時は必要な情報を私に質問する

職業:
機械学習エンジニア

あなたについての詳細:
私の通常業務として、Python、PyTorchを使って画像処理や機械学習を実装することが多く、streamlitやFlaskを使用してwebアプリを開発しています。
また、APIを通じてgpt-4oをベースとしたツールを開発することがあり、システム設計をすることもあります。
なお、時々TypescriptやNode.jsを使用したWeb開発をすることもあります。

私のデバイス情報:
 ・Mac book pro M4 
 ・メモリは24GB
 ・pipバージョン 25.2
 ・Pythonバージョン 3.9.16
 ・PyTorch バージョン 2.4.1
 ・transformers 4.48.0

コーディングガイドライン:
 ・ネストは 最大4段まで に制限してください。
 ・深いネストになりそうな場合は、早期リターン(ガード節) を使ってください。
 ・共通処理は 関数に切り出す ことでネストを浅くしてください。
 ・if/elif の連鎖は ディスパッチ表や辞書マッピング で整理してください。
 ・try-except は必要最小限のスコープで書き、ネストを深くしないでください。
 ・try文のなかでtry文を書かない
 ・ネストが深くなりそうな場合は、continue / break を活用して早めにループを抜けてください。
 ・関数内処理を長く書かない。長くなるなら関数を分ける。
 ・for文の中でのfor文のループは2回までとする。 

出力結果

カスタマイズ後の動作を確認するため、以下のプロンプトを入力しました。

以下の要件に基づいて、学習スクリプトを作成してください。 
【目的】 
事前学習済みの EfficientNetV2 モデルを使って画像分類を行う。 
【条件】 
- PyTorch 2.4 以上 
- torchvision.models.efficientnet_v2_s(事前学習済み)を使用 
- CIFAR-10 データセットで動作 
- main() 関数で全体を制御する構成にする 
- モデルの定義など設定はconfig.pyとして作成する 
- データの読み込みなど実行に関するメイン処理はtrain.pyとして作成する  
- データの読み込みのみsys.argv[1]でコマンドライン引数を適切に使う 
追加要件: - GPU対応(device = "cuda" if torch.cuda.is_available() else "cpu")

その結果、添付ファイルに示す出力結果を得られることとなりました。

Claude

Claudeは、長文処理に強みを持つAIモデルです。

会話や文書要約のような自然言語タスクだけでなく、コーディングや技術文書の生成にも高い性能を発揮します。

特に最近リリースされた Claude Sonnet 4.5 は、現時点で最も高性能なモデルの一つとも言われています。(次はなんのモデルが最も高性能と呼ばれるようになるのか気になりますね。)

カスタマイズ

Claudeのカスタマイズは非常にシンプルです。

設定メニューから「プロファイル」を開くと、ユーザーの職種や説明文などを自由に編集できます。

今回の例では、職種を「エンジニア」に設定し、説明文にはChatGPTと同じ内容を使用しました。

このように同一条件で設定することで、ツールごとの出力傾向の違いを比較しやすくなります

出力結果

コーディング出力を比較するため、以下のプロンプトを入力しました。

以下の要件に基づいて、学習スクリプトを作成してください。 
【目的】 
事前学習済みの EfficientNetV2 モデルを使って画像分類を行う。 
【条件】 
- PyTorch 2.4 以上 
- torchvision.models.efficientnet_v2_s(事前学習済み)を使用 
- CIFAR-10 データセットで動作 
- main() 関数で全体を制御する構成にする 
- モデルの定義など設定はconfig.pyとして作成する 
- データの読み込みなど実行に関するメイン処理はtrain.pyとして作成する  
- データの読み込みのみsys.argv[1]でコマンドライン引数を適切に使う 
追加要件: - GPU対応(device = "cuda" if torch.cuda.is_available() else "cpu")

その結果、添付ファイルに示す出力結果を得られることとなりました。

おわりに

いかがでしたでしょうか。

今回は、既存のAIツールでもカスタマイズによって出力結果を自在に調整できることを紹介しました。

意外とカスタマイズ機能を活用していない方も多いかも思いますが、少し設定を工夫するだけで、コーディング支援にとどまらず、業務全体をサポートするAIツールへと進化させることが可能です。

私個人としては、AIの出力を「自分の書くコードにどこまで近づけられるか」が密かな目標です。

今回の検証では、思いがけず各ツールのコーディングスタイルや品質の違いを比較する形になりましたが、結果としてはClaudeの出力が最も自分のスタイルに近いと感じました。

最後に、どのツールもそれぞれの強みがあり、用途や目的に応じてカスタマイズすることが最大のポイントだと思いますので、ぜひご活用してみてください。