ใช้ Excel เป็นเครื่องมือในการคัดลอกข้อมูลจากเว็บ


การขูดเว็บเป็นการสกัดข้อมูลข้อมูลหรือภาพจากเว็บไซต์โดยใช้วิธีการอัตโนมัติ คิดว่ามันเป็นการคัดลอกและวางแบบอัตโนมัติเต็มรูปแบบ

เราเขียนหรือใช้แอพเพื่อไปยังเว็บไซต์ที่เราต้องการและทำสำเนาสิ่งที่เราต้องการจากเว็บไซต์เหล่านั้น มันแม่นยำกว่า ดาวน์โหลดเว็บไซต์ทั้งหมด.

เช่นเดียวกับเครื่องมือใด ๆ การขูดเว็บสามารถใช้ดีหรือชั่วก็ได้เหตุผลที่ดีกว่าสำหรับการขูดเว็บไซต์จะจัดอันดับไว้ในเครื่องมือค้นหา ขึ้นอยู่กับเนื้อหาการเปรียบเทียบราคาสินค้าหรือการตรวจสอบข้อมูลการตลาด คุณอาจใช้เป็นเครื่องมือในการวิจัยได้

<รูป class = "lazy aligncenter">

ฉันจะขูดเว็บไซต์ด้วย Excel ได้อย่างไร

เชื่อหรือไม่ว่า Excel มีความสามารถในการแยกเว็บไซต์ datafrom มาเป็นเวลานานอย่างน้อยตั้งแต่ Excel 2003 มันเป็นเพียงแค่นั้น การสแกนเว็บเป็นสิ่งที่คนส่วนใหญ่ไม่คิดถึงลองนึกถึงการใช้โปรแกรม aspreadsheet เพื่อทำงาน แต่มันเป็นเรื่องง่ายและทรงพลังอย่างน่าประหลาดใจลองเรียนรู้วิธีการทำโดยการรวบรวมชุดแป้นพิมพ์ลัดของ Microsoft Office

ค้นหาไซต์ที่คุณต้องการขูด

สิ่งแรกที่เราจะทำ สิ่งที่ต้องทำคือค้นหาหน้าเว็บเฉพาะที่เราต้องการรับข้อมูล ไปที่แหล่งข้อมูลแล้วค้นหาที่ https://support.office.com/ เราจะใช้คำค้นหา“ ทางลัดที่ใช้บ่อย” เราสามารถทำให้เฉพาะเจาะจงมากขึ้นโดยใช้ชื่อของแอพเฉพาะเช่น Outlook, Excel, Word และอื่น ๆ อาจเป็นความคิดที่ดีที่จะคั่นหน้าผลลัพธ์เพื่อให้เราสามารถกลับไปที่นั่นได้อย่างง่ายดาย

<รูป class = "lazy aligncenter">

คลิกที่ผลการค้นหา“ แป้นพิมพ์ลัดใน Excel forWindows” เมื่ออยู่ในหน้านั้นให้ค้นหารายการเวอร์ชันของ Excel และคลิกที่ เวอร์ชันที่ใหม่กว่าตอนนี้เรากำลังทำงานกับรุ่นล่าสุดและยอดเยี่ยมที่สุด

เราสามารถกลับไปที่หน้าผลการค้นหาของเราและเปิดใช้งานแอป Office อื่น ๆ ทั้งหมดในแท็บของตนเองและคั่นหน้าพวกเขา เป็นความคิดที่ดีแม้กระทั่งสำหรับการออกกำลังกายนี้ นี่คือที่คนส่วนใหญ่จะหยุด incollecting ทางลัด Office แต่ไม่ใช่พวกเรา เราจะนำไปไว้ใน Excel ดังนั้นเราสามารถทำสิ่งที่เราต้องการได้ทุกเมื่อที่ต้องการ

เปิด Excel และของขูด

เปิด Excel และเริ่มสมุดงานใหม่ บันทึกเวิร์กบุ๊กเป็น ทางลัด Officeหากคุณมี OneDrive ให้บันทึกที่นั่นเพื่อให้คุณลักษณะ บันทึกอัตโนมัติทำงานได้

เมื่อบันทึกเวิร์กบุคแล้วให้คลิกที่แท็บ ข้อมูล

ในแถบริบบิ้นของแท็บข้อมูล คลิกที่ จากเว็บ

<รูป class = "lazy aligncenter">

วิซาร์ด จากเว็บจะเปิดขึ้น นี่คือที่เราใส่ที่อยู่เว็บหรือ URL ของเว็บไซต์จากที่เราต้องการขูดข้อมูล สลับไปยังเว็บเบราว์เซอร์ของคุณและ คัดลอกURL

วาง URL ลงใน URLของฟิลด์จากตัวช่วยสร้างเว็บ เราสามารถเลือกใช้สิ่งนี้ในโหมด พื้นฐานหรือ ขั้นสูงโหมดขั้นสูงช่วยให้เรามีตัวเลือกมากขึ้นในการเข้าถึงข้อมูลจากเว็บไซต์ สำหรับแบบฝึกหัดนี้เราต้องใช้โหมดพื้นฐานเท่านั้น คลิก ตกลง

Excel จะพยายามเชื่อมต่อกับเว็บไซต์ อาจใช้เวลาสักครู่ เราจะเห็นหน้าต่างแสดงความคืบหน้าหากเป็นเช่นนั้น

<รูป class = "lazy aligncenter">

หน้าต่าง นาวิเกเตอร์จะเปิดขึ้นและเราจะเห็นรายการตารางจากเว็บไซต์ทางด้านซ้ายเมื่อเราเลือกหนึ่งแล้วเราจะเห็นตัวอย่างตารางใน ขวา. ลองเลือกตาราง ทางลัดที่ใช้บ่อย

<รูป class = "lazy aligncenter">

เราสามารถคลิกที่แท็บ WebViewเพื่อดูเว็บไซต์จริงหากเราต้องการดูตารางที่เราต้องการ เมื่อเราพบมันเราสามารถคลิกที่มันและมันจะถูกเลือกสำหรับการนำเข้า

<รูป class = "lazy aligncenter">

ตอนนี้เราคลิกที่ปุ่ม โหลดที่ด้านล่างของหน้าต่างนี้ มีตัวเลือกอื่น ๆ ที่เราสามารถเลือกได้ซึ่งมีความซับซ้อนและเกินขอบเขตของการขูดครั้งแรกของเรา เพิ่งรู้ว่าพวกเขาอยู่ที่นั่น ความสามารถในการขูดเว็บของ Excel นั้นมีประสิทธิภาพมาก

ตารางเว็บจะถูกโหลดใน Excel หลังจากนั้นสองสามวินาทีเราจะเห็นข้อมูลทางด้านซ้ายซึ่งมีหมายเลข 1อยู่ในภาพด้านล่าง หมายเลข 2จะไฮไลต์ ข้อความค้นหาที่ใช้ในการรับข้อมูลจากเว็บไซต์ เมื่อเรามีหลายแบบสอบถามในเวิร์กบุ๊กนี่คือที่ที่เราเลือกที่เราต้องการใช้

<รูป class = "lazy aligncenter">

ขอให้สังเกตว่าข้อมูลเข้ามาในสเปรดชีตเป็น Exceltable มีการตั้งค่าไว้แล้วเพื่อให้เราสามารถกรองหรือเรียงลำดับข้อมูล

เราสามารถทำขั้นตอนนี้ซ้ำสำหรับหน้าเว็บอื่น ๆ ทั้งหมดที่มีทางลัด Office ที่เราต้องการสำหรับ Outlook, Word, Access, PowerPoint และแอป Office อื่น ๆ

การเก็บข้อมูลที่คัดลอกเป็นปัจจุบันใน Excel

เป็นโบนัสสำหรับคุณเรากำลังจะเรียนรู้วิธีทำให้ข้อมูลของเรามีความสดใหม่ใน Excel นี่เป็นวิธีที่ยอดเยี่ยมในการแสดงให้เห็นว่า Excel มีพลังเพียงใดในการคัดลอกข้อมูล แม้จะมีสิ่งนี้เราก็ทำการขูดขั้นพื้นฐานที่สุดที่ Excel สามารถทำได้

สำหรับตัวอย่างนี้เราจะใช้หน้าเว็บข้อมูลหุ้นเช่น https://www.cnbc.com/stocks/

<รูป class = "lazy aligncenter">

ผ่านสิ่งที่เราทำมาก่อนและคัดลอกและวาง URL ใหม่จากแถบที่อยู่

คุณจะไปที่หน้าต่าง Navigator และดูตารางที่มีอยู่ ลองเลือกดัชนีหุ้นสหรัฐฯที่สำคัญ

เมื่อข้อมูลถูกคัดลอกไปแล้วเราจะเห็นแผ่นกระดาษต่อไปนี้

ทางด้านขวาเราจะเห็นข้อความค้นหาสำหรับดัชนีหุ้นหลักของสหรัฐอเมริกาเลือกว่าจะให้มีการเน้น ตรวจสอบให้แน่ใจว่าเราอยู่ในแท็บ เครื่องมือตารางและในพื้นที่ ออกแบบจากนั้นคลิกลูกศรลงใต้ รีเฟรชจากนั้นคลิกที่ คุณสมบัติการเชื่อมต่อ

<ร่างคลาส = "lazy aligncenter">

ในหน้าต่าง QueryPropertiesภายใต้แท็บ การใช้งานเราสามารถ ควบคุมวิธีการรีเฟรชข้อมูลนี้ เราสามารถตั้งค่าช่วงเวลาที่เฉพาะเจาะจงเพื่อรีเฟรชหรือเพื่อรีเฟรชเมื่อเราเปิดเวิร์กบุ๊กในครั้งต่อไปหรือทำการรีเฟรชในพื้นหลังหรือการรวมกันของสิ่งเหล่านี้ เมื่อเราเลือกสิ่งที่ต้องการให้คลิกที่ ตกลงเพื่อปิดหน้าต่างและดำเนินการต่อ

<รูป class = "lazy aligncenter">

แค่นี้แหละ! ตอนนี้คุณสามารถติดตามราคาหุ้นคะแนนกีฬาหรือข้อมูลอื่น ๆ ที่เปลี่ยนแปลงบ่อยจากสเปรดชีต Excel หากคุณพอใจกับ สมการและฟังก์ชันของ Excel คุณสามารถทำเกือบทุกอย่างที่คุณต้องการด้วยข้อมูล

อาจลองระบุแนวโน้มหุ้นเล่นพูลกีฬาแฟนตาซีในที่ทำงานหรืออาจติดตามสภาพอากาศ ใครจะรู้? จินตนาการและข้อมูลของคุณบนอินเทอร์เน็ตเป็นเพียงข้อ จำกัด เท่านั้น

Excel - Copy Sheet

กระทู้ที่เกี่ยวข้อง:


22.06.2019