http://d.hatena.ne.jp/tomisima/20070903/1188836400
こちらは各キャリアの利用IPアドレス紹介ページをパースすることで取得しています。
こちらで紹介しているDocomoをパースする部分は
return [ip for ip in re.findall(r'<li>([\d\./]+)%lt;/li>', content, re.M)]
となっているのですが、時折Docomoさんのページでは、
のようにliタグの間にIPアドレス情報以外の文字が入っているとその部分は取得されません。
なので以下のように私はしてみています。
return [ip for ip in re.findall(r'<li>([\d\.]+/[\d]+).*</li>', content, re.M)]
これで文字が入っていても取得できます。
ただし未来の追加の部分もとってしまったりします。
この取得したIPアドレス帯情報を利用してキャリア判別をしています。
0 件のコメント:
コメントを投稿