← Back to team overview

sslug-teknik team mailing list archive

Re: Frameunderstøttelse og wget

 

On Wed, Aug 21, 2002 at 18:24:00 +0200, Hans Christian Studt wrote:

> Jeg vil gerne kunne accesse følgende url
> www.helsinge-kommune.dk
> fra et script, men jeg får bare en meddelelse om der kræves en browser der understøtter frames.
> 
> prøv for eksempel :
> wget --user-agent=MSIE www.helsinge-kommune.dk

Der er frames, og det er noget snavs, men det findes på
mange hjemmesider.
I stedet kunne  anvendes noget dynamisk med php, asp, SSI eller lignende.
Det anvendes på SSLUG, berlingske, computerworld og mange andre
steder.

Hvis du nu ser på den html du henter:

....snip....
<FRAMESET  rows="*,0">
<FRAME  src="body.asp" name="body" frameborder="no" NORESIZE>
</FRAMESET>
  <noframes>
    <body bgcolor="#FFFFFF">
      Denne side kræver browser med understøttelse af frames.
    </body>
  </noframes>

Så skal du hente "body.asp" som også er frames (suk)!,
fordi der er lavet en frame med KUN et link, virkelig tåbeligt....
nåh hent body.asp :

...snip
<FRAMESET  cols="167,*" framespacing="0" border="false" frameborder="0">
<FRAME  src="tree.asp?rootId=1057994" name="list" marginwidth="0" marginheight="0" frameborder="no" >
<FRAME  src="info.asp?infoId=1160173&startSide=1" name="info" frameborder="no">
</FRAMESET>
  <noframes>
    <body bgcolor="#FFFFFF">
      Denne side kræver browser med frames.
    </body>
  </noframes>
</html>

Jer er der så 2 links videre som man skal fortsætte i osv.

Brug evt. wget med noget mirror option og begræns dybde til 2 eller 3
og med lidt held for du det meste henter.
F.eks. noget i stil med
  wget -r -N -l 2 -nr --user-agent=MSIE www.helsinge-kommune.dk/

Det bliver dog ligeså rodet som hjemmesiden er opbygget med frames....


-- 
mvh Frank Damgaard  | 



Follow ups

References