如何才能在网页中找到并提取所有链接?

如何才能在网页中找到并提取所有链接?

方法 1:使用 JavaScript

function getAllLinks() {
  const links = document.querySelectorAll('a');
  return links;
}

const links = getAllLinks();

console.log(links);

方法 2:使用 HTML DOM API

const links = document.querySelectorAll('a');

console.log(links);

方法 3:使用 DOMParser

const parser = new DOMParser();
const doc = parser.parseFromString(document.documentElement.outerHTML, 'text/html');

const links = doc.querySelectorAll('a');

console.log(links);

方法 4:使用 Regular Expressions

const regex = /]*>[^<]*/g;
const links = document.querySelectorAll(regex);

console.log(links);

注意:

  • document.querySelectorAll('a') 返回所有与 a 元素相关的元素,包括内部链接。
  • document.querySelectorAll('a') 的结果是一个数组。
  • 您可以根据需要修改正则表达式以提取特定的链接类型。
相似内容
更多>