Playground

Python3.xでURLを開く&URLエンコード

この記事は約2分で読めます。
スポンサーリンク

Python2とPython3でURLの開き方が異なります. (Python2から入ったので結構戸惑った)

メモとしてPython3でのやり方を記述

ついでにURLエンコードも記述

#!/usr/bin/env python
# -*- coding: utf-8 -*-
import urllib.request

hoge = 'みかん'
hoge_encode = urllib.parse.quote(hoge) #URLエンコード

#hoge_encodeを変数urlと連結
#とりあえずwikiのapiを取得している
url = 'http://ja.wikipedia.org/w/api.php?action=query&prop=revisions&rvprop=content&format=xml&titles=' + hoge_encode

response = urllib.request.urlopen(url) #ここでURLを開く
html = response.read()

urllib.parse.quote() で文字列をURLにエンコードしています.

(ex) みかん → %E3%81%BF%E3%81%8B%E3%82%93

urllib.request.urlopen() でURLの情報を取得し、解析しやすくなるようにread()をしています.

あとはlxmlを使って必要な要素を取り出したりすると良いかもしれません(こんなかんじ)

<参考>

コメント

タイトルとURLをコピーしました