【コピペOK】正規表現をAIで自動作成!ChatGPTでテキスト抽出・一括置換を瞬殺する手順
開発・プログラミング

【コピペOK】正規表現をAIで自動作成!ChatGPTでテキスト抽出・一括置換を瞬殺する手順

プログラミング知識は不要!ChatGPTを使って「正規表現」を自動生成し、大量の文章からメールアドレスを抽出したり、表記ゆれを一括置換したりする方法を解説します。テキストエディタやExcelでの面倒な文字処理をAIで自動化し、数時間かかる手作業を数秒で終わらせる時短テクニックです。

「膨大なテキストデータからメールアドレスだけを抽出したい」「バラバラな日付の表記ゆれを一括置換したい」……日々の業務や開発において、このような文字処理で困っていませんか?

エンジニアはもちろん、プログラミング学習者や非エンジニアのビジネスパーソンにとっても、手作業でのテキスト修正や抽出は大きな時間のロスです。そこで威力を発揮するのが「正規表現」という技術ですが、暗号のような記号の羅列をゼロから覚えるのは非常にハードルが高いのが現実です。

本記事では、プログラミング知識がなくてもできる、正規表現をAIで自動作成し、ChatGPTでテキスト抽出・一括置換を瞬殺する手順を詳しく解説します。

この記事を読めば、以下のことが分かります。

  • 正規表現とAI(ChatGPT)を掛け合わせるメリット
  • ChatGPTでそのまま使えるコピペOKのプロンプト
  • 実践的なユースケース(抽出・置換・ログ解析)
  • 正規表現をテストして実務(エディタやスプレッドシート)で使う方法

面倒なデータクレンジング作業をAIで自動化し、生産性を劇的に向上させましょう!

---

正規表現とは?AI(ChatGPT)で自動作成する最大のメリット

テキスト処理の強力な武器である「正規表現」ですが、学習の難しさが長年の課題でした。しかし、AIを活用することでその常識は覆ります。

テキスト抽出や一括置換に必須の技術

正規表現(Regular Expression)とは、文字列のパターンを1つの形式で表現するための記法です。特定の文字列そのものを検索するのではなく、「数字が4桁連続している」「@マークが含まれる」といった条件(パターン)を指定して検索や置換を行います。

例えば、顧客リストから電話番号だけを抽出したり、異なるフォーマットの日付(例:2026/04/29、2026-04-29、2026年4月29日)をひとつの形式に一括置換したりする際に欠かせない技術です。

学習コストゼロ!数時間の手作業を数秒へ

正規表現の最大のデメリットは「学習コストの高さ」です。^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}$ のような難解な文字列を記述しなければならず、学習につまずく人も少なくありません。

しかし、ChatGPTをはじめとするAIを活用すれば、「こういう文章からこういうデータを抜き出したい」と日本語で指示するだけで、完璧な正規表現を自動作成してくれます。従来なら数日間の学習や、数時間の手作業が必要だったデータ成形が、AIを使えばプロンプトを入力するだけのわずか数秒で完了します。まさに作業時間を99%削減できる時短テクニックです。

ポイント: 正規表現の暗記はもう不要。AIに「目的」と「具体例」を伝えるだけで、複雑な文字処理の自動化が実現します。

---

【コピペOK】ChatGPTで正規表現を自動作成する基本プロンプト

【コピペOK】正規表現をAIで自動作成!ChatGPTでテキスト抽出・一括置換を瞬殺する手順
【コピペOK】正規表現をAIで自動作成!ChatGPTでテキスト抽出・一括置換を瞬殺する手順

AIに精度の高い正規表現を作らせるには、プロンプト(指示文)に「対象のテキスト例」「抽出(または置換)したい結果」「使用するツールや言語」を含めるのがコツです。

抽出・検索用のプロンプト例

特定のデータを抜き出したい場合や、検索したい場合は以下のテンプレートをコピペして使用してください。

```text

以下の条件を満たす正規表現を作成してください。

【目的】

大量のテキストデータから「〇〇(例:郵便番号)」だけを抽出したいです。

【対象テキスト例】

・〒123-4567 東京都...

・郵便番号 9876543 は...

【期待するマッチ結果】

・123-4567

・9876543

【使用環境】

VS Code(または Googleスプレッドシートなど)

【その他】

・正規表現のコードのみを出力し、その後で簡単な解説を添えてください。

```

一括置換・整形用のプロンプト例

表記ゆれを統一するなど、データを書き換えたい場合は、「置換後のフォーマット」もAIに指示します。

```text

以下の条件でテキストを一括置換するための正規表現と、置換用文字列を作成してください。

【目的】

バラバラな日付表記を「YYYY-MM-DD」形式に統一したいです。

【対象テキスト例】

・2026/4/29

・2026年04月29日

・26.4.29

【期待する置換結果】

・2026-04-29

【使用環境】

Python(または任意のツール)

```

ポイント: AIへの指示は「Before(元のテキスト)」と「After(どうしたいか)」を具体的に書くことで、一発で正確な正規表現が生成されます。

---

実践!AIを活用した正規表現のユースケース3選

【コピペOK】正規表現をAIで自動作成!ChatGPTでテキスト抽出・一括置換を瞬殺する手順
【コピペOK】正規表現をAIで自動作成!ChatGPTでテキスト抽出・一括置換を瞬殺する手順

ここでは、実際の開発現場や事務作業でよく遭遇する課題を解決するための具体的なユースケースを3つ紹介します。

1. 大量の文章からメールアドレスや電話番号を抽出する

顧客からの問い合わせメールや、Webサイトのスクレイピングデータの中に散らばっている連絡先をリスト化したい場合です。

AIが生成する正規表現の例(メールアドレス抽出):

```regex

[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}

```

この正規表現を使えば、文章の途中に埋もれている「info@example.com」のようなメールアドレス部分だけを正確にハイライトし、抽出することが可能になります。

2. 表記ゆれ(全角・半角、日付フォーマット)を一括置換する

顧客データなどのCSVファイルをデータベースにインポートする際、データの形式が揃っていないとエラーになります。例えば、全角数字と半角数字が混在している電話番号のハイフンを削除する処理などです。

AIが生成する正規表現の例(電話番号のハイフン削除):

  • 検索パターン: ([0-90-9]{2,4})[--]+([0-90-9]{2,4})[--]+([0-90-9]{3,4})
  • 置換パターン: $1$2$3 (※ツールによって \1\2\3 の場合あり)

これにより、「03-1234-5678」も「090-1234-5678」も、ハイフンなしの連続した数字に一括置換されます。

3. ログファイルから特定のエラーメッセージだけを抜き出す

エンジニア向けのユースケースです。数万行に及ぶサーバーのログファイルの中から、「2026-04-29」に発生した「ERROR」もしくは「FATAL」の行だけを抽出したい場合、手作業では不可能です。

AIが生成する正規表現の例:

```regex

^2026-04-29.?(ERROR|FATAL).$

```

この正規表現をテキストエディタの検索機能に入力すれば、障害調査の時間を大幅に短縮できます。

ポイント: 連絡先の抽出、データのクレンジング、ログ解析など、ビジネスのあらゆる場面で正規表現による自動化が役立ちます。

---

自動作成した正規表現をテスト・実行する方法(ツール紹介)

ChatGPTが作成した正規表現は、普段使っているツールですぐに実行できます。代表的な活用方法を紹介します。

テキストエディタ(VS Codeなど)での活用

プログラマーに人気の「Visual Studio Code (VS Code)」などのエディタには、標準で正規表現を使った検索・置換機能が備わっています。

  1. Ctrl + F(Macは Cmd + F)で検索窓を開く。
  2. 検索窓の右側にある 「.*」アイコン(正規表現を使用する) をクリックしてオンにする。
  3. AIが作った正規表現を貼り付けると、対象の文字列がハイライトされます。

GoogleスプレッドシートやExcelでの活用

非エンジニアの方には、Googleスプレッドシートの関数がおすすめです。無料で強力な正規表現機能が使えます。

  • REGEXEXTRACT関数: セルから指定パターンを抽出

例: =REGEXEXTRACT(A2, "[0-9]{3}-[0-9]{4}")

  • REGEXREPLACE関数: セル内の指定パターンを置換

例: =REGEXREPLACE(A2, "年|月", "-")

Excelの場合は標準関数での正規表現対応が遅れていましたが、近年のアップデートで REGEXTEST などの新関数が追加されつつあり、VBAを使わずとも処理が可能になってきています。

Regex101などのオンラインテストツールの併用

AIが作成した正規表現が複雑な場合、いきなり本番データに適用するのは危険です。「Regex101(regex101.com)」のような無料のオンラインツールに正規表現とテストテキストを貼り付けると、どの部分がマッチしているかを視覚的に確認・デバッグできます。

ポイント: VS Codeの検索機能やスプレッドシートの関数と組み合わせることで、ノーコードで高度なテキスト処理が完了します。

---

AIによる正規表現作成で失敗しないためのコツと注意点

AIは非常に優秀ですが、指示が曖昧だと予期せぬ文字までマッチしてしまうことがあります。

対象データと除外データの条件を明確にする

プロンプトを作成する際、「抽出したい例」だけでなく「除外したい例(マッチさせたくない文字列)」も併記すると精度が跳ね上がります。

例えば「拡張子が .jpg のファイル名は抽出したいが、.jpeg は除外したい」といった具合に、境界値を明確に指示しましょう。

必ずテスト環境で検証してから本番データに適用する

一括置換(Replace All)を実行する前には、必ずファイルのバックアップを取るか、先述の Regex101 等でテストを行ってください。間違った正規表現で数万件のデータを上書きしてしまうと、復旧に多大な時間を要するリスクがあります。

ポイント: AIへの指示には「例外パターン」も含め、実行前には必ずバックアップを取る習慣をつけましょう。

---

まとめ

本記事では、ChatGPTを使って正規表現を自動作成し、テキスト抽出や一括置換を瞬殺する手順を解説しました。

  • 正規表現の学習はAIに代替可能: 暗記不要で、作業時間を数時間から数秒へ短縮。
  • プロンプトの工夫が鍵: Before(入力例)とAfter(期待する結果)、および除外例を明確にする。
  • 様々なツールで実行可能: VS Code、Googleスプレッドシート、Pythonなどで即座に活用できる。

正規表現は、エンジニアから事務職まで幅広く役立つスキルです。ぜひ今日から、手作業で行っている面倒なテキスト処理をAIに任せ、より創造的な業務に時間を使いましょう!

---

よくある質問(FAQ)

Q. 正規表現はどのツールや言語で使えますか?

VS Codeやサクラエディタなどのテキストエディタ、Googleスプレッドシート、Excelのほか、Python、JavaScript、PHPなどほぼすべてのプログラミング言語で標準的にサポートされています。AIにプロンプトを出す際、「Python用」「スプレッドシート用」と指定するとツールごとの微妙な記法の違いを調整してくれます。

Q. ChatGPTの無料版でも正規表現を正しく生成できますか?

はい、無料版のChatGPTでも十分に精度の高い正規表現を生成可能です。正規表現は数学的なルールに基づいているため、AIが得意とする分野の一つです。より複雑な条件や長文のパターンの場合は、最新の高性能モデルを使用することをおすすめします。

Q. AIが作成した正規表現がうまく動かない場合の対処法は?

「期待通りに動作しませんでした。〇〇というテキストもマッチしてしまいます」と、エラーの起きた状況をそのままAIにフィードバック(再質問)してください。AIが自らパターンを修正し、改善版の正規表現を再提示してくれます。

Q. ExcelとGoogleスプレッドシート、どちらが正規表現を使いやすいですか?

現状、手軽に正規表現を使うならGoogleスプレッドシートがおすすめです。REGEXEXTRACTREGEXREPLACE といった関数が標準で用意されており、特別な設定なしですぐに利用できます。Excelも最新版で正規表現関数が実装されつつありますが、環境によってはVBA(マクロ)を組む必要があります。

#正規表現#ChatGPT#AI開発#テキスト抽出#業務効率化
この記事はAIによって自動生成されています。内容の正確性については、原典をご確認ください。