【REGEXMATCH】カスタム数式で都道府県を含む/含まないセルの抽出方法

regexmatch スプシの使い方

カスタム数式でREGEXMATCHを使って、都道府県のセルを抽出・削除する方法を解説します。
【関連記事】【REGEXMATCH】カスタム数式で市区町村名を含む/含まないセルの抽出方法

カスタム数式で都道府県を含むセルを抽出・削除する方法

以下のスプレッドシートA列の中で、「都道府県名」を含むセルのみを抽出する方法を解説します。
regexmatch
A1をクリックし、フィルタをクリックします。
regexmatch
「条件でフィルタ」の中から、「カスタム数式」を選択します。
次に「値または数式」と薄い文字で書かれた箇所に以下をコピペし、「OK」を選択します。

=REGEXMATCH(A:A,"北海道|青森|岩手|宮城|秋田|山形|福島|茨城|栃木|群馬|埼玉|千葉|東京|神奈川|新潟|富山|石川|福井|山梨|長野|岐阜|静岡|愛知|三重|滋賀|京都|大阪|兵庫|奈良|和歌山|鳥取|島根|岡山|広島|山口|徳島|香川|愛媛|高知|福岡|佐賀|長崎|熊本|大分|宮崎|鹿児島|沖縄")
regexmatch
これで、都道府県名のついたキーワードのみが抽出されました。
都道府県名がついたキーワードが不要な場合は、削除することで、都道府県名がついていないキーワードのみを表示させることができます。

行政区分単位(都・道・府・県)を含めた抽出方法

より正確に都道府県名を抽出したい場合は、各都道府県名に行政区分単位(都・道・府・県)を追加した以下の数式を使用することもできます。

=REGEXMATCH(A:A,"北海道|青森県|岩手県|宮城県|秋田県|山形県|福島県|茨城県|栃木県|群馬県|埼玉県|千葉県|東京都|神奈川県|新潟県|富山県|石川県|福井県|山梨県|長野県|岐阜県|静岡県|愛知県|三重県|滋賀県|京都府|大阪府|兵庫県|奈良県|和歌山県|鳥取県|島根県|岡山県|広島県|山口県|徳島県|香川県|愛媛県|高知県|福岡県|佐賀県|長崎県|熊本県|大分県|宮崎県|鹿児島県|沖縄県")

この数式を使用すると、「東京」だけでなく「東京都」という完全な表記も検出できるようになります。また、「京都府」「大阪府」のように「府」がつく都道府県や、「北海道」のように「道」がつく都道府県も正確に抽出できます。

SEO分析などで地域名を正確に判別したい場合は、この行政区分単位を含めた数式の使用をおすすめします。

カスタム数式で都道府県を含まないセルを抽出・削除する方法

含まないセルを抽出する場合は数式の先頭にnotをつける必要があります。

=NOT(REGEXMATCH(A:A, "北海道|青森|岩手|宮城|秋田|山形|福島|茨城|栃木|群馬|埼玉|千葉|東京|神奈川|新潟|富山|石川|福井|山梨|長野|岐阜|静岡|愛知|三重|滋賀|京都|大阪|兵庫|奈良|和歌山|鳥取|島根|岡山|広島|山口|徳島|香川|愛媛|高知|福岡|佐賀|長崎|熊本|大分|宮崎|鹿児島|沖縄"))
これで都道府県名を含まない文字列だけを抽出することができます。
同様に、行政区分単位を含めた都道府県名を除外したい場合は以下の数式を使用します。
=NOT(REGEXMATCH(A:A,"北海道|青森県|岩手県|宮城県|秋田県|山形県|福島県|茨城県|栃木県|群馬県|埼玉県|千葉県|東京都|神奈川県|新潟県|富山県|石川県|福井県|山梨県|長野県|岐阜県|静岡県|愛知県|三重県|滋賀県|京都府|大阪府|兵庫県|奈良県|和歌山県|鳥取県|島根県|岡山県|広島県|山口県|徳島県|香川県|愛媛県|高知県|福岡県|佐賀県|長崎県|熊本県|大分県|宮崎県|鹿児島県|沖縄県"))

よくある問題と解決方法

  1. 全角・半角の違いによる問題
    • データ内の都道府県名が全角・半角混在している場合、正確に抽出できない可能性があります
    • 事前にデータの正規化を行うことをお勧めします
  2. 都道府県名の誤字・表記揺れへの対応
    • 「東京都」「東京」など、表記揺れがある場合は正規表現パターンを調整する必要があります
    • 必要に応じて正規表現パターンを拡張してください
  3. 行政区分単位の選択
    • データの性質に合わせて、行政区分単位を含める/含めない数式を選択してください
    • 両方の数式を組み合わせることで、より精度の高い抽出も可能です

コメント