今回はPythonでページ内にあるaタグすべてを取得する方法を解説します。
aタグとは?
「Anchor(アンカー)」の略で、リンクの出発点や到達点を指定するタグで、記述方法は以下の通りです。
<a href=””></a>
“”の間には移動先のURLを記述し、><の間にはページに表示させたいテキストを記述します。
「トップページ」というテキストを押すと、当サイトのトップページに移動する、というaタグの場合は以下の通り記述します。
<a href=”https://prorautatie.net/”>トップページ</a>
実際にソースコードを反映させると以下のようになります。
ソースコード
import urllib.request as req
from bs4 import BeautifulSoup
url = "https://prorautatie.net/"
response = req.urlopen(url)
parse_html = BeautifulSoup(response, "html.parser")
print(parse_html.find_all('a'))
title_lists[3:10]
コメント