PHP:$url = 'http://vg.no/aktuelt.html'; $curl = curl_init($url); curl_setopt($curl, CURLOPT_RETURNTRANSFER, TRUE); $response = curl_exec($curl); $code = curl_getinfo($curl, CURLINFO_HTTP_CODE); if($code == 404) { // lenken eksisterer ikke } curl_close($curl);
Høres noe unormalt ut å bruke PHP til å finne alle lenker til et gitt domene på sine egne nettsider ?
$url = 'http://www.nettside.no';
$curl = curl_init($url);
curl_setopt($curl, CURLOPT_RETURNTRANSFER, TRUE);
$response = curl_exec($curl);
curl_close($curl);
$dom = new DOMDocument;
$dom->loadHTML($response);
foreach ($dom->getElementsByTagName('a') as $node) {
$url = $node->getAttribute('href');
if ( $url === 'vg.no/aktuelt.html ' ) { // eller regex matching osv ?
// Tada
}
}
$url = 'http://www.vg.no/forbruker/mat-og-drikke/mat/';
$curl = curl_init($url);
curl_setopt($curl, CURLOPT_RETURNTRANSFER, TRUE);
$response = curl_exec($curl);
curl_close($curl);
$dom = new DOMDocument;
$dom->loadHTML($response);
foreach ($dom->getElementsByTagName('a') as $node) {
$url2 = $node->getAttribute('href');
if ( $url2 === 'http://www.vg.no/nyheter/innenriks/mat/norskproduserte-baer-er-ikke-norske/a/10122630/' ) {
echo "link eksisterer";
} else {
echo "link eksisterer ikke";
}
}