python 正規表現 複数 変換

PC

Pythonで文字列変換をする際、変換したい文字列を正規表現で指定していた場合の対処の仕方です。
正規表現で指定しているっていうことはですね。
文字列がある程度の規則性はもっているものの、決して一種類ではないから正規表現にしているわけですが、これをまたある規則に則って変換するとなると結構ハードルがありました。

例えば、文章の中にファイルとか画像へのリンクを混ぜておくとかいう場合、下書き段階ではサクサク書きたいのでざっくりとそのファイル名だけ仮置しておく、なんてことがあるわけです。
ファイル名が「test1.jpg」とかだったら、「##test1.jpg##」といった具合に。
一つの文章の中に複数個こういうものが出てきたとして、それぞれ「##test2.jpg##」とか「##test3.jpg##」とかにして文章は書きなぐります、と。
で、それをいざ本番環境に書き写す際にどうしたら楽に変換できるだろうか、というところで頭を使ってみました。
正規表現としては「##.*##」となります。
で、必要な処理としては、前後の「##」を削った上でファイルの格納場所を指定するハイパーリンク相当の何かを付け足す、となります。
で、最初は単純に変換式を書いたんですね。

import re

img_fle_s = re.search('##.*##', sentense)[0]
img_fle = img_fle_s.replace('#', '')
sentense = re.sub(img_fle_s,'<img src="' + url_img + img_fle + '" alt="' + title + '" width="320" />',sentense)

実行してみて気づきましたが、これ、一番最初に出てくる「##.*##」を満たすファイル名で全部変換されちゃうんですね。
最初に一回しかファイル名を特定していないので当たり前なんですが。

それで考えたのが、for文で上から順に正規表現にひっかかるものを処理していく、というやり方。

import re

cnts_img_fle = len(re.findall('##.*##', sentense))
for i in range(0, cnts_img_fle):
     img_fle_s = re.search('##.*##', sentense)[0]
     img_fle = img_fle_s.replace('#', '')
     sentense = re.sub(img_fle_s,'<img src="' + url_img + img_fle + '" alt="' + title + '" width="320" />',sentense)

文章中、正規表現に引っかかる箇所の個数を最初に特定してやり、その個数分だけ上から順に変換をかける、と。

これでうまくいきました。

Python本

Python[完全]入門 [ 松浦健一郎 ]
Python[完全]入門 [ 松浦健一郎 ] 3,190円(税込)【送料込】

楽天ブックス

松浦健一郎 司ゆき SBクリエイティブパイソンカンゼンニュウモン マツウラケンイチロウ ツカサユキ 発行年月:2021年01月25日 予約締切日:2020年10月01日 ページ数:592p サイズ:単

Pythonでできる! 株価データ分析 [ 片渕彼富 ]
Pythonでできる! 株価データ分析 [ 片渕彼富 ] 2,970円(税込)【送料込】

楽天ブックス

片渕彼富 山田 祥寛 森北出版パイソンデデキルカブカデータブンセキ カタフチ カノトミ ヤマダ ヨシヒロ 発行年月:2023年01月21日 予約締切日:2022年12月03日 ページ数:256p サイ

徹底攻略Python 3 エンジニア認定[基礎試験]問題集 [ 株式会社ビープラウド ]
徹底攻略Python 3 エンジニア認定[基礎試験]問題集 [ 株式会社ビープラウド ] 2,640円(税込)【送料込】

楽天ブックス

株式会社ビープラウド 一般社団法人Pythonエンジニア育成推進協会 インプレステッテイコウリャクパイソンスリーエンジニアニンテイキソシケンモンダイシュウ カブシキガイシャビープラウド イッパンシャダ

入門Python3 第2版 [ Bill Lubanovic ]
入門Python3 第2版 [ Bill Lubanovic ] 4,180円(税込)【送料込】

楽天ブックス

Bill Lubanovic 鈴木 駿 オライリー・ジャパンニュウモンパイソンスリーダイニハン ビル ルバノビック スズキ ハヤオ 発行年月:2021年03月22日 予約締切日:2021年01月27日

スッキリわかるPython入門 第2版 (スッキリわかる入門シリーズ) [ 国本 大悟 ]
スッキリわかるPython入門 第2版 (スッキリわかる入門シリーズ) [ 国本 大悟 ] 2,750円(税込)【送料込】

楽天ブックス

スッキリわかる入門シリーズ 国本 大悟 須藤 秋良 インプレススッキリワカルパイソンニュウモンダイニハン クニモト ダイゴ スドウ アキヨシ 発行年月:2023年11月06日 予約締切日:2023年0

楽天ウェブサービスセンター
タイトルとURLをコピーしました