错误方法
最早使用下面的方法,一直获取不成功.
1
2
|
title = soup.find("meta", name="description")
title = soup.find("meta", name="keywords")
|
正确方法
在beautiful soup中应该使用 property=<…> 而不是 name=<…> 来获取元标记。 以下是获得所需内容的最终代码:
1
2
3
4
5
|
#获取description
md_desc = soup.find('head').find('meta', attrs={'name': 'description'})['content']
#获取keywords
md_keywords = soup.find('head').find('meta', attrs={'name': 'keywords'})['content']
|
另一种方法
通过2次find方法
1
2
3
|
meta = soup.findall("meta")
title = meta.find(name="description")
image = meta.find(name="keywords")
|