如何才能在网页中找到并提取所有链接?
方法 1:使用 JavaScript
function getAllLinks() {
const links = document.querySelectorAll('a');
return links;
}
const links = getAllLinks();
console.log(links);
方法 2:使用 HTML DOM API
const links = document.querySelectorAll('a');
console.log(links);
方法 3:使用 DOMParser
const parser = new DOMParser();
const doc = parser.parseFromString(document.documentElement.outerHTML, 'text/html');
const links = doc.querySelectorAll('a');
console.log(links);
方法 4:使用 Regular Expressions
const regex = /]*>[^<]*/g;
const links = document.querySelectorAll(regex);
console.log(links);
注意:
-
document.querySelectorAll('a')
返回所有与a
元素相关的元素,包括内部链接。 -
document.querySelectorAll('a')
的结果是一个数组。 - 您可以根据需要修改正则表达式以提取特定的链接类型。