sslug-teknik team mailing list archive
-
sslug-teknik team
-
Mailing list archive
-
Message #54000
Re: Frameunderstøttelse og wget
On Wed, Aug 21, 2002 at 18:24:00 +0200, Hans Christian Studt wrote:
> Jeg vil gerne kunne accesse følgende url
> www.helsinge-kommune.dk
> fra et script, men jeg får bare en meddelelse om der kræves en browser der understøtter frames.
>
> prøv for eksempel :
> wget --user-agent=MSIE www.helsinge-kommune.dk
Der er frames, og det er noget snavs, men det findes på
mange hjemmesider.
I stedet kunne anvendes noget dynamisk med php, asp, SSI eller lignende.
Det anvendes på SSLUG, berlingske, computerworld og mange andre
steder.
Hvis du nu ser på den html du henter:
....snip....
<FRAMESET rows="*,0">
<FRAME src="body.asp" name="body" frameborder="no" NORESIZE>
</FRAMESET>
<noframes>
<body bgcolor="#FFFFFF">
Denne side kræver browser med understøttelse af frames.
</body>
</noframes>
Så skal du hente "body.asp" som også er frames (suk)!,
fordi der er lavet en frame med KUN et link, virkelig tåbeligt....
nåh hent body.asp :
...snip
<FRAMESET cols="167,*" framespacing="0" border="false" frameborder="0">
<FRAME src="tree.asp?rootId=1057994" name="list" marginwidth="0" marginheight="0" frameborder="no" >
<FRAME src="info.asp?infoId=1160173&startSide=1" name="info" frameborder="no">
</FRAMESET>
<noframes>
<body bgcolor="#FFFFFF">
Denne side kræver browser med frames.
</body>
</noframes>
</html>
Jer er der så 2 links videre som man skal fortsætte i osv.
Brug evt. wget med noget mirror option og begræns dybde til 2 eller 3
og med lidt held for du det meste henter.
F.eks. noget i stil med
wget -r -N -l 2 -nr --user-agent=MSIE www.helsinge-kommune.dk/
Det bliver dog ligeså rodet som hjemmesiden er opbygget med frames....
--
mvh Frank Damgaard |
Follow ups
References