プログラミング

Pythonでre subに関数を渡してコールバックして処理する

re.subではre.sub([正規表現], [置換], [テキスト])のような文法ですが、この”置換”の部分をプログラマブルに変化させたい、それも”正規表現”でマッチした部分のグループマッチを使用して。

そういう場合、以下のように”置換”に関数やラムダを渡すことが出来ます。

(関数)

import re

number_mapping = {'1': 'one',
                  '2': 'two',
                  '3': 'three'}

def callback(x):
  return number_mapping[x.group()]

print re.sub(r'\d', callback, "1 testing 2 3")
one testing two three

(ラムダ)

import re

number_mapping = {'1': 'one',
                  '2': 'two',
                  '3': 'three'}

print re.sub(r'\d', lambda x: number_mapping[x.group()], "1 testing 2 3")
one testing two three

regex – Passing a function to re.sub in Python – Stack Overflow
regex – Using a regular expression to replace upper case repeated letters in python with a single lowercase letter – Stack Overflow