ページ内にあるURL(aタグ)をすべて取得する方法を解説

今回はPythonでページ内にあるaタグすべてを取得する方法を解説します。

aタグとは?

「Anchor(アンカー)」の略で、リンクの出発点や到達点を指定するタグで、記述方法は以下の通りです。

<a href=””></a>

“”の間には移動先のURLを記述し、><の間にはページに表示させたいテキストを記述します。

「トップページ」というテキストを押すと、当サイトのトップページに移動する、というaタグの場合は以下の通り記述します。

<a href=”https://prorautatie.net/”>トップページ</a>

実際にソースコードを反映させると以下のようになります。

トップページ

ソースコード

import urllib.request as req

from bs4 import BeautifulSoup

url = "https://prorautatie.net/"
response = req.urlopen(url)
parse_html = BeautifulSoup(response, "html.parser")
print(parse_html.find_all('a'))
title_lists[3:10]

 

python
パソコンお役立ちブログ

コメント