ChatGPTを使ったチャンク収集ガイド
ChatGPTに代表されるチャット型AIツールを使って、業務や専門分野に関連するチャンクを効率よく集める方法をお伝えするガイドです。
チャット型AIツールは日々進化しており、また、多少の試行錯誤でユーザー各自に最適化した使い方を工夫することができます。
そのため本ガイドでご紹介する方法がベストであるとは限りませんが、叩き台としてご活用ください。
目次
- AIツールとチャンク収集
- 従来のチャンク収集法
- 主なチャット型AIツール
- チャンク収集のアプローチ
- 収集できるチャンクの種類
- 日本語と英語のどちらで質問するか
- 【A】ChatGPT単体で会話やチャンクを生成させる
- 1-1 会話を作らせる
- 1-2 会話のバリエーションを作らせる
- 2-1 動詞チャンクと名詞チャンクを抽出
- 2-2 例文等の作成
- 3 対象範囲を限って徐々に狭めていく
- 4 文頭チャンクの取り出し
- 【B】業務関連の手持ちのチャンクを見本として提示し、ChatGPTに同様のチャンクを生成させる
- 出力される英文レベルの調整
AIツールとチャンク収集
従来のチャンク収集法
ChatGPT以前、主に次のようなソースからチャンクを集める方がありました。
- ビジネスメールやビジネス文書
- 会議の文字起こし(Otter.aiなどアプリの活用)
- 実際のビジネス上の会話
- 自社や競合他社のウェブサイト、関連業界他社のウェブサイト
- 職種に特化したネット上の記事やブログ、新聞・雑誌
- 市販の英語学習教材
- 英語の書籍(ラダーシリーズ等など学習者向け語彙制限本を含む)
これらの方法では非常に時間がかかったり、必ずしも役立つチャンクが収集できるとは限りませんでした。しかし、これらの方法もChatGPTと組合わせて、より前向きに活用することが可能です。
主なチャット型AIツール
2023年8月時点で、代表的な主要チャット型AIツールは以下の3つになります。
※Bingそのものは検索エンジンなので、BingのChatを使う必要があります
チャンク収集目的に使いやすいのはChatGPTとBing AI Chatです。Bing AI Chatの3つのモードのうち「クリエイティブ (More Creative) 」を使うと、ChatGPTよりも内容の濃い、長めの会話を作れる場合が多いです。
チャンク収集のアプローチ
アプローチとしては主に下記の2つあります。2つを組合わせることも可能です。
【A】ChatGPT単体で会話やチャンクを生成させる
【B】業務関連の手持ちのチャンクを見本としてChatGPTに与え、同様のチャンクを生成させる
収集できるチャンクの種類
本ガイドでは次の3つのチャンクを扱います。
- 動詞をコアにした「動詞チャンク」
- 名詞をコアにした「名詞チャンク」
- 文の型(構文)を決定する「文頭チャンク」
日本語と英語のどちらで質問するか
本ガイドでお伝えするチャンク収集方法に関してのみ言えば、英語でも日本語でも大きな違いはありません。
【A】ChatGPT単体で会話やチャンクを生成させる
該当業務やトピックのチャンクを広く万遍なく集めるのに特に役立つアプローチです。
1-1 会話を作らせる
会話のトピックは該当業務に関して広めにカバーする一般的なものから作らせ、必要に応じて対象範囲を限って徐々に狭めていきます。
【プロンプト例1】
日本の自動車メーカーがインドの自動車メーカーと技術提携と合弁会社設立に関する交渉を行なっています。典型的な会話を英語で作ってください。日本語訳を文中に示してください。
【プロンプト例2】
社内会議で4p分析を行なっています。典型的な会話を英語で作成してください。参加者は3名。業界は製薬。日本語訳を文中に示してください。
1-2 会話のバリエーションを作らせる
最初に生成された会話に自分が欲しいトピックが含まれていなかった場合は、それを含むように再度生成させます。
例えば、上の「日本の自動車メーカーとインドの自動車メーカーの技術提携・合弁会社設立」の会話で出資比率への言及がなかったが、これが欲しい場合は下記のプロンプトを入力します。
【プロンプト例】
この会話を作り直してください。合弁会社の出資比率に関する発言を加えてください。
ChatGPT、Bing AI Chatとも同じプロンプト(質問・命令)に対して何度も違う回答を生成できるので会話のバリエーションを得ることができます。
ChatGPTは “Regenerate Response(回答の再生成)” をさせると、既に生成済みの回答が消されてしまうので、その会話も役立てたい場合はコピペして保存しておく必要があります。
2-1 動詞チャンクと名詞チャンクを抽出
生成された会話からチャンクを取り出します。まず「動詞チャンク」「名詞チャンク」を取り出します。
【プロンプト例】
この会話から動詞チャンクと名詞チャンクを取り出し、日本語訳も示してください。動詞チャンクの例:form a joint venture company; finalize the contract; proceed with this partnership
動詞チャンクは生成された会話から動詞チャンクを数個選んで例として与えたほうがよいです。そうしないと動詞一語だけで抽出することがあるからです。
動詞チャンク、名詞チャンクとは?
動詞チャンクは次の3タイプとなります。
- 動詞+目的語
- 動詞+目的語+補語(SVOC文型のVOC)
- 動詞+間接目的語+直接目的語(SVOO文型のVOO)
プロンプトは「動詞チャンク」とするだけで普通は十分です。特にこだわるならば、次のようなプロンプトも与えることが可能ですが、これでChatGPTが正しく回答するとは限りません。
【プロンプト例】
この会話から次の形の動詞チャンクを取り出してください。「動詞+目的語+補語」。例:XXXX。日本語訳をつけてください。
名詞チャンクは多種多様ですが、まだ生成AIは十分に理解できません。現時点では「名詞チャンク」とだけの指示が妥当です。
「重要語句」を抽出するように、と命令すると「名詞チャンク」と指示したのとほぼ同じチャンクが抽出されることが多いです。
【名詞チャンク例】
分詞+名詞 | working contract |
名詞+形容詞 | something wrong, the best condition imaginable |
名詞+前置詞句 | reasons for the delay |
名詞+不定詞句・分詞句 | the method to use |
名詞+関係詞節 | the hotel where we stayed |
抽出された動詞チャンクや名詞チャンクの数が会話文の長さの割には少ない場合は、「さらに20個」等と多めに指示することで、漏れなく抽出されやすくなります。
その際「2語からなる名詞チャンク」等と条件をつけ、例を与えることで、より精度の高い答えが返ってくます。
2-2 例文等の作成
抽出された動詞チャンクと名詞チャンクを使った例文が欲しい場合、次のようなプロンプトが使えます。
【プロンプト例】
抽出された動詞チャンクと名詞チャンクそれぞれに例文を二つずつ作ってください。ビジネスにおける会話で使う文体で作ってください。日本語訳もつけてください。
3 対象範囲を限って徐々に狭めていく
広めの範囲で生成された会話に対し、対象範囲を限って狭めていくことで、より深堀した会話が生成されます。そうした会話ならではのチャンクが収集できます。
会話の一部をとって
「●●に関して、この会話をさらに続けてください」
「●●に関して、この会話をさらに深めてください」
「●●に関して意見が対立し、激しい議論になりました」
といったプロンプトが考えられます。
上述の「日本の自動車メーカーとインドの自動車メーカーの技術提携・合弁会社設立」の会話を例に使ったプロンプト例を挙げます。
【プロンプト例1】
合弁会社の出資比率に関して、会話を発展させてください。日本語訳もつけてください。
【プロンプト例2(例1で生成された会話をさらに掘り下げるもの)】
各社の貢献度と責任に基づいた比例的な投資に関して意見が対立し激しい議論となりました。典型的な会話を作ってください。
このようにして生成された会話からチャンクを取り出していきます。
4 文頭チャンクの取り出し
動詞チャンクや名詞チャンクだけでなく、それらを収める「構文」の手持ちも増やしていく必要があります。「構文」とは、いわば文の「型」ですが、ここでもチャンクの概念を活かすことができます。
「チャンク」という用語の定義にはさまざまな学説がありますが、文頭の3~5語も一つのカタマリとして捉えることが可能なので、これを「文頭チャンク」と呼び、その文の型を決定するチャンクと考えます。(「構文」は文の後半でも決まった「型」が登場することもあるので、「文頭チャンク」は「構文」の一種類と考えることもできます。)
生成AIが「構文」「文の出だし」「文頭チャンク」と言った言葉をどこまで認識しているか不明な部分もありますが、欲しいチャンクの例を与えずとも、以下のようなプロンプトを与えることで文頭チャンクが生成されます。
- 議論に有効な文の出だしと構文
- 議論に有効な構文
- 議論に有効な文の出だし
- 議論に有効な文頭表現
- 議論に有効な文頭チャンク
コンスタントに良い結果が生成されるのは、現時点では一番上に挙げている「議論に有効な文の出だしと構文」です。
【プロンプト例】
これらの全ての会話から議論に有効な文の出だしと構文を抽出してください。日本語訳もつけてください。例:It's crucial that we; Regarding the operational responsibilities; I see your point, but
※例を与えることで精度が高くなります。
【B】業務関連の手持ちのチャンクを見本として提示し、ChatGPTに同様のチャンクを生成させる
このアプローチが特に有効なのは、対象分野のチャンクのストックが多少でもある場合です。
自分の業務の中から収集した業務特化のチャンクや、市販教材やネット検索で収集した業務特化のチャンクとなります。(市販教材でも多くの分野が扱われるようになってきてはいますが、学習者が特定業務に特化するほど、実務で必要なだけの量は確保できないのが普通です。)
以下はITプロジェクトのフェーズの一つにおけるチャンク収集例です。
【プロンプト例】
ITプロジェクトのシステムテストにおいて使う英語の動詞チャンクと名詞チャンクを教えてください。
動詞チャンクの例:cause fault conditions; generate test data
名詞チャンクの例:within a limited period; transaction per second; restrictions item for
出力される英文レベルの調整
出力された英文の難易度のレベルを変えたい場合、いったん会話や例文を生成さた後に、英文のレベルを指定して書き直させることができます。
レベル指定には英語運用能力の国際標準規格とされているCEFRの基準を使うのがお勧めです。
C2 | 熟達した言語使用者 | 聞いたり読んだりした、ほぼ全てのものを容易に理解することができる。いろいろな話し言葉や書き言葉から得た情報をまとめ、根拠も論点も一貫した方法で再構築できる。自然に、流暢かつ正確に自己表現ができる。 |
C1 | いろいろな種類の高度な内容のかなり長い文章を理解して、含意を把握できる。言葉を探しているという印象を与えずに、流暢に、また自然に自己表現ができる。社会生活を営むため、また学問上や職業上の目的で、言葉を柔軟かつ効果的に用いることができる。複雑な話題について明確で、しっかりとした構成の詳細な文章を作ることができる。 | |
B2 | 自立した言語使用者 | 自分の専門分野の技術的な議論も含めて、抽象的な話題でも具体的な話題でも、複雑な文章の主要な内容を理解できる。母語話者とはお互いに緊張しないで普通にやり取りができるくらい流暢かつ自然である。幅広い話題について、明確で詳細な文章を作ることができる。 |
B1 | 仕事、学校、娯楽などで普段出会うような身近な話題について、標準的な話し方であれば、主要な点を理解できる。その言葉が話されている地域にいるときに起こりそうな、たいていの事態に対処することができる。身近な話題や個人的に関心のある話題について、筋の通った簡単な文章を作ることができる。 | |
A2 | 基礎段階の言語使用者 | ごく基本的な個人情報や家族情報、買い物、地元の地理、仕事など、直接的関係がある領域に関しては、文やよく使われる表現が理解できる。簡単で日常的な範囲なら、身近で日常の事柄について、単純で直接的な情報交換に応じることができる。 |
A1 | 具体的な欲求を満足させるための、よく使われる日常的表現と基本的な言い回しは理解し、用いることができる。自分や他人を紹介することができ、住んでいるところや、誰と知り合いであるか、持ち物などの個人的情報について、質問をしたり、答えたりすることができる。もし、相手がゆっくり、はっきりと話して、助けが得られるならば、簡単なやり取りをすることができる。 |
(出典) ブリティッシュ・カウンシル、ケンブリッジ大学英語検定機構
生成AIで返ってくるビジネスにおける会話文の返答は、B1からB2レベルだと言えます。
このガイドでプロンプトを例に挙げた会話は対外的な会話なので、ほぼB2レベルに収まっているようです。これを例えばB1レベルに書き直させると、明らかにオリジナルの会話よりも語彙が少なく、短め、よりシンプルな文章となります。
B1レベルで話せれば特に失礼ということもなく、とりあえずはビジネスで充分なコミュニケーションはとれます。よって対外的な会話を生成したものの、自分で使うには文のレベルが高すぎる場合は、B1レベルに書き直させるのもよいです。
【プロンプト例(レベルを指示する)】
この会話をCEFR B1レベルの英語で書き直してください。
ただし、受動語彙(聞いて分かる、読んで分かる)を増やすためには、オリジナルの会話から抽出したチャンクは、しっかりと覚えておくことは大切です。
また、よりプロフェッショナルな口調、時にはやや堅い口調を目指すのであれば、オリジナルの会話の文体・口調を使えれば望ましいです。