Cześć,
Chciałem zarchiwizować sobie witrynę, bo ma być za niedługo usunięta, używam polecenia:
$ wget -m -R "*.jpg, *.gif, *png" - https://ousamaranking.wbijam.pl/
ale nie pobiera mi jej całej, bo podstrone ściąga normalnie np: https://ousamaranking.wbijam.pl/pierwsza_seria-14.html
ale nie chce pobrać z niej następnej strony z odtwarzaczem np: https://ousamaranking.wbijam.pl/odtwarz ... SRN1W.html
https://imgur.com/gallery/81KLRlh
Mógłby mi ktoś wytłumaczyć co źle robię? Przy użyciu webhttptrack jest ten sam problem
wget - nie chce pobrać całej witryny
- mario_7
- Administrator
- Posty: 8613
- Rejestracja: 30 sie 2006, 13:11
- Płeć: Mężczyzna
- Wersja Ubuntu: 20.04
- Środowisko graficzne: GNOME
- Architektura: x86_64
Re: wget - nie chce pobrać całej witryny
To pewnie wina tego, że na stronie są skrypty które dodają linki itp. Wget jest prostym narzędziem - nie renderuje strony, a jedynie pobiera jej zawartość. Jeśli są na niej skrypty, które nie zadziałają lokalnie po pobraniu, to części rzeczy nie zobaczysz na pobranej kopii.
Aby w pełni odwzorować stronę w lokalnej kopii zapewne musiałbyś użyć czegoś z Chrome Headless albo podobnym, np. tutaj: https://pptr.dev/
Aby w pełni odwzorować stronę w lokalnej kopii zapewne musiałbyś użyć czegoś z Chrome Headless albo podobnym, np. tutaj: https://pptr.dev/
- jacekalex
- Gibki Gibbon
- Posty: 4679
- Rejestracja: 17 cze 2007, 02:54
- Płeć: Mężczyzna
- Wersja Ubuntu: inny OS
- Środowisko graficzne: MATE
- Architektura: x86_64
Re: wget - nie chce pobrać całej witryny
Problemy rozwiązujemy na forum nie na PW -> Niech inni na tym skorzystają.
Komputer jest jak klimatyzacja - gdy otworzysz okna, robi się bezużyteczny...
Linux User #499936
Inny OS: Gentoo Linux
Komputer jest jak klimatyzacja - gdy otworzysz okna, robi się bezużyteczny...
Linux User #499936
Inny OS: Gentoo Linux
Kto jest online
Użytkownicy przeglądający to forum: Obecnie na forum nie ma żadnego zarejestrowanego użytkownika i 8 gości