Python2とPython3でURLの開き方が異なります. (Python2から入ったので結構戸惑った)
メモとしてPython3でのやり方を記述
ついでにURLエンコードも記述
#!/usr/bin/env python # -*- coding: utf-8 -*- import urllib.request hoge = 'みかん' hoge_encode = urllib.parse.quote(hoge) #URLエンコード #hoge_encodeを変数urlと連結 #とりあえずwikiのapiを取得している url = 'http://ja.wikipedia.org/w/api.php?action=query&prop=revisions&rvprop=content&format=xml&titles=' + hoge_encode response = urllib.request.urlopen(url) #ここでURLを開く html = response.read()
urllib.parse.quote() で文字列をURLにエンコードしています.
(ex) みかん → %E3%81%BF%E3%81%8B%E3%82%93
urllib.request.urlopen() でURLの情報を取得し、解析しやすくなるようにread()をしています.
あとはlxmlを使って必要な要素を取り出したりすると良いかもしれません(こんなかんじ)
<参考>
- Hatena::Group::python http://python.g.hatena.ne.jp/mhrs/20060609/p1
- Pythonリファレンス http://docs.python.jp/3/library/urllib.request.html
- StackOverFlow http://stackoverflow.com/questions/21713527/xml-parsing-from-web-response
コメント