Paano Gamitin ang wget Linux Command upang Mag-download ng Mga Web na Pahina at Mga File

Ang wget utility ay nagbibigay-daan sa iyo upang i-download ang mga web page, mga file at mga imahe mula sa web gamit ang Linux command line.

Maaari mong gamitin ang isang solong wget command sa sarili nitong mag-download mula sa isang site o mag-set up ng isang input file upang mag-download ng maramihang mga file sa maraming mga site.

Ayon sa manu-manong pahina wget maaaring magamit kahit na ang user ay naka-log out ng system. Upang gawin ito ay gagamitin mo ang command na nohup.

Ang wget utility ay muling susubukan ang isang pag-download kahit na ang koneksyon ay bumaba, magpapatuloy mula sa kung saan ito umalis kung posible kapag bumalik ang koneksyon.

Maaari mong i-download ang buong mga web site gamit ang wget at i-convert ang mga link upang ituro sa mga lokal na mapagkukunan upang maaari mong tingnan ang isang website offline.

Ang mga tampok ng wget ay ang mga sumusunod:

Paano Upang I-download ang Isang Website Gamit ang wget

Para sa gabay na ito, ipapakita ko sa iyo kung paano i-download ang aking personal na blog.

wget www.everydaylinuxuser.com

Ito ay nagkakahalaga ng paglikha ng iyong sariling folder sa iyong machine gamit ang mkdir command at pagkatapos ay lumipat sa folder gamit ang cd command .

Halimbawa:

mkdir everydaylinuxuser
cd everydaylinuxuser
wget www.everydaylinuxuser.com

Ang resulta ay isang solong file index.html. Sa sarili nitong, ang file na ito ay medyo walang silbi dahil ang nilalaman ay nakuha pa rin mula sa Google at ang mga imahe at stylesheet ay gaganapin pa rin sa Google.

Upang i-download ang buong site at lahat ng mga pahina na magagamit mo ang sumusunod na command:

wget -r www.everydaylinuxuser.com

Na-download na ito ang mga pahina ng recursively hanggang sa pinakamataas na 5 antas ng malalim.

5 antas ng malalim ay maaaring hindi sapat upang makuha ang lahat mula sa site. Maaari mong gamitin ang -l switch upang itakda ang bilang ng mga antas na nais mong pumunta sa mga sumusunod:

wget -r -l10 www.everydaylinuxuser.com

Kung nais mong walang katapusan na recursion maaari mong gamitin ang mga sumusunod:

wget -r -l inf www.everydaylinuxuser.com

Maaari mo ring palitan ang inf sa 0 na nangangahulugang ang parehong bagay.

Mayroon pa ring isang problema. Maaari mong makuha ang lahat ng mga pahina nang lokal ngunit ang lahat ng mga link sa mga pahina ay tumuturo pa rin sa kanilang orihinal na lugar. Kaya't hindi posible na mag-click nang lokal sa pagitan ng mga link sa mga pahina.

Maaari kang makakuha sa paligid ng problemang ito sa pamamagitan ng paggamit ng -k switch na nag-convert ng lahat ng mga link sa mga pahina upang ituro sa kanilang lokal na nai-download na katumbas tulad ng sumusunod:

wget -r -k www.everydaylinuxuser.com

Kung nais mong makakuha ng isang kumpletong salamin ng isang website maaari mo lamang gamitin ang mga sumusunod na lumipat na tumatagal ang layo ng pangangailangan para sa paggamit ng -r -k at -l switch.

wget -m www.everydaylinuxuser.com

Samakatuwid kung mayroon kang sariling website maaari kang gumawa ng isang kumpletong backup gamit ang isang simpleng command.

Patakbuhin ang wget Bilang Isang Background Command

Maaari kang makakuha ng wget na tumakbo bilang isang command sa background na umaalis na magagawa mong makapagsayaw sa iyong trabaho sa terminal window habang ang mga pag-download ng mga file.

Gamitin lamang ang sumusunod na command:

wget -b www.everydaylinuxuser.com

Maaari mong siyempre pagsamahin ang mga switch. Upang patakbuhin ang command ng wget sa background habang ang pag-mirror sa site ay gagamitin mo ang sumusunod na command:

wget -b -m www.everydaylinuxuser.com

Maaari mong pasimplehin ito nang higit pa tulad ng sumusunod:

wget -bm www.everydaylinuxuser.com

Pagtotroso

Kung pinapatakbo mo ang wget command sa background hindi mo makikita ang alinman sa mga normal na mensahe na ipinapadala nito sa screen.

Maaari mong makuha ang lahat ng mga mensaheng iyon na ipinadala sa isang log file upang maaari mong suriin ang pag-unlad sa anumang oras gamit ang command na buntot .

Upang mag-output ng impormasyon mula sa wget command sa isang log file gamitin ang sumusunod na command:

wget -o / path / to / mylogfile www.everydaylinuxuser.com

Ang kabaligtaran, siyempre, ay hindi nangangailangan ng pag-log sa lahat at walang output sa screen. Upang alisin ang lahat ng output gamitin ang sumusunod na command:

wget -q www.everydaylinuxuser.com

I-download Mula sa Maramihang Mga Site

Maaari kang mag-set up ng isang input file upang i-download mula sa maraming iba't ibang mga site.

Buksan up ng isang file gamit ang iyong mga paboritong editor o kahit na ang cat command at simulan lamang ang listahan ng mga site o mga link upang i-download mula sa bawat linya ng file.

I-save ang file at pagkatapos ay patakbuhin ang sumusunod na command wget:

wget -i / path / to / inputfile

Bukod sa pag-back up ng iyong sariling website o marahil sa paghahanap ng isang bagay upang i-download upang basahin sa tren, ito ay malamang na hindi mo nais na i-download ang isang buong website.

Ikaw ay mas malamang na mag-download ng isang solong URL na may mga larawan o marahil mag-download ng mga file tulad ng zip file, ISO file o mga file ng imahe.

Na sa isip na hindi mo nais na i-type ang mga sumusunod sa input file na ito ay oras-ubos:

Kung alam mo na ang base URL ay laging magkapareho maaari mo lamang tukuyin ang sumusunod sa input file:

Pagkatapos ay maaari mong ibigay ang base URL bilang bahagi ng command na wget tulad ng sumusunod:

wget -B http://www.myfileserver.com -i / path / to / inputfile

Subukang muli ang Mga Pagpipilian

Kung na-set up mo ang isang queue ng mga file upang i-download sa loob ng isang input file at iniwan mo ang iyong computer na nagpapatakbo ng lahat ng gabi upang i-download ang mga file ikaw ay medyo annoyed kapag bumaba ka sa umaga upang makita na ito ay natigil sa unang file at ay muling sinusubok lahat ng gabi.

Maaari mong tukuyin ang bilang ng mga retries gamit ang sumusunod na switch:

wget -t 10 -i / path / to / inputfile

Baka gusto mong gamitin ang utos sa itaas kasabay ng -T switch na nagbibigay-daan sa iyo upang tukuyin ang isang timeout sa mga segundo tulad ng sumusunod:

wget -t 10 -T 10 -i / path / to / inputfile

Ang utos sa itaas ay muling susubukan ng 10 beses at susubukan na kumonekta para sa 10 segundo para sa bawat link sa file.

Ito ay medyo nakakainis kapag nakuha mo ang bahagyang na-download na 75% ng isang 4 gigabyte na file sa isang mabagal na koneksyon sa broadband para lamang sa iyong koneksyon na mag-drop out.

Maaari mong gamitin ang wget upang muling subukan mula sa kung saan ito tumigil sa pag-download sa pamamagitan ng paggamit ng sumusunod na command:

wget -c www.myfileserver.com/file1.zip

Kung ikaw ay pumuputok sa isang server ang host ay hindi maaaring magustuhan ito ng masyadong maraming at maaaring block o patayin ang iyong mga kahilingan.

Maaari mong tukuyin ang isang panahon ng paghihintay na tumutukoy kung gaano katagal maghintay sa pagitan ng bawat pagsasauli tulad ng sumusunod:

wget -w 60 -i / path / to / inputfile

Ang utos sa itaas ay maghihintay ng 60 segundo sa pagitan ng bawat pag-download. Ito ay kapaki-pakinabang kung ikaw ay nagda-download ng maraming mga file mula sa iisang pinagmulan.

Ang ilang mga web host ay maaaring makita ang dalas gayunpaman at i-block mo pa rin. Maaari mong gawin random ang paghihintay ng panahon upang gawin itong mukhang hindi mo ginagamit ang isang programa tulad ng sumusunod:

wget --random-wait -i / path / to / inputfile

Pagprotekta sa Mga Limitasyon sa Pag-download

Maraming mga internet service provider ay nag-aaplay pa rin sa mga limitasyon ng pag-download para sa paggamit ng iyong broadband, lalo na kung nakatira ka sa labas ng isang lungsod.

Baka gusto mong magdagdag ng isang quota upang hindi mo hipan ang limitasyon sa pag-download. Maaari mo itong gawin sa sumusunod na paraan:

wget -q 100m -i / path / to / inputfile

Tandaan na ang -q command ay hindi gagana sa isang solong file.

Kaya't kung nag-download ka ng isang file na 2 gigabytes ang laki, ang paggamit ng -q 1000m ay hindi titigil sa pag-download ng file.

Ang quota ay inilapat lamang kapag recursively download mula sa isang site o kapag gumagamit ng isang input file.

Pagkuha Sa Pamamagitan ng Seguridad

Kinakailangan ka ng ilang mga site na mag-log in upang ma-access ang nilalaman na nais mong i-download.

Maaari mong gamitin ang mga sumusunod na switch upang tukuyin ang username at password.

wget --user = yourusername --password = yourpassword

Tandaan sa isang multi user system kung ang isang tao ay nagpapatakbo ng PS command na makikita nila ang iyong username at password.

Iba pang Mga Opsyon sa Pag-download

Sa pamamagitan ng default ang -r switch ay recursively i-download ang nilalaman at lilikha ng mga direktoryo kung saan ito napupunta.

Maaari mong makuha ang lahat ng mga file upang i-download sa isang folder gamit ang sumusunod na switch:

wget -nd -r

Ang kabaligtaran nito ay upang pilitin ang paglikha ng mga direktoryo na maaaring makamit gamit ang sumusunod na utos:

wget -x -r

Paano Upang I-download ang Mga Uri ng Mga Uri ng File

Kung nais mong mag-download ng recursively mula sa isang site ngunit nais mo lamang i-download ang isang tiyak na uri ng file tulad ng isang mp3 o isang imahe tulad ng isang png maaari mong gamitin ang sumusunod na syntax:

wget -A "* .mp3" -r

Ang kabaligtaran nito ay huwag pansinin ang ilang mga file. Marahil hindi mo nais na i-download ang mga executable. Sa kasong ito, gagamitin mo ang sumusunod na syntax:

wget -R "* .exe" -r

Cliget

May isang Firefox add-on na tinatawag na cliget. Maaari mong idagdag ito sa Firefox sa sumusunod na paraan.

Bisitahin ang https://addons.mozilla.org/en-US/firefox/addon/cliget/ at i-click ang pindutang "idagdag sa Firefox".

I-click ang pindutan ng pag-install kapag lumilitaw ito. Kakailanganin mong i-restart ang Firefox.

Upang gamitin ang cliget bisitahin ang isang pahina o file na nais mong i-download at i-right click. Ang isang menu ng konteksto ay lilitaw na tinatawag na cliget at magkakaroon ng mga pagpipilian upang "kopyahin sa wget" at "kopyahin upang kulutin".

I-click ang pagpipiliang "kopya sa wget" at buksan ang isang terminal window at pagkatapos ay i-right click at i-paste. Ang angkop na utos ng wget ay ilalagay sa window.

Talaga, ini-imbak mo ang pag-type mo mismo ng utos.

Buod

Ang wget command bilang isang malaking bilang ng mga pagpipilian at switch.

Kaya't nararapat na basahin ang manu - manong pahina para sa wget sa pamamagitan ng pag-type ng mga sumusunod sa isang terminal window:

tao wget