Chrome uchun Scraper kengaytmasi bo'yicha Semalt qo'llanma

Har qanday biznes omon qolishi va pirovardida o'sishi uchun uning raqobatchilaridan va turli xil xavf-xatarlardan oldinda turish kerak. Analitik ma'lumotlarga asoslanib qarorlar qabul qilish - bu muammolarni unutishning ishonchli usuli. Bunday ma'lumotlarni ma'lumotlarni yig'ish orqali olish mumkin. Aynan shu erda Chrome uchun kazıyıcı kengaytmasi keladi: bu nafaqat ma'lumotlarni yig'ish jarayonini osonlashtiradi, balki murakkab sozlashsiz ham parchalanishga imkon beradi.

Scraper-dan qanday foydalanish kerak

    1. Siz qilishingiz kerak bo'lgan birinchi narsa - kengaytmani o'rnatish, shuning uchun Chrome veb-do'koniga boring, "kazıyıcı" -ni qidirib toping va "Chrome-ga qo'shish" ni bosing.

    2. Ma'lumotni olib tashlamoqchi bo'lgan veb-saytga o'ting, sizni qiziqtirgan yozuvni belgilab qo'ying. Sichqonchaning o'ng tugmachasini bosing va ochilgan menyuda "shunga o'xshash parchalarni" tanlang.

    3. Buni amalga oshirsangiz, alohida kazıyıcı konsol oynasi ochiladi. Bu erda siz parchalangan ma'lumotlarning ro'yxatini ko'rasiz.

    4. Tarkibni saqlash uchun "Google hujjatlariga saqlash" ni bosing, bu avtomatik ravishda ma'lumotlarni Google elektron jadvaliga eksport qiladi.

Kengaytirilgan hurdalar

Agar siz ko'proq ma'lumotlarni qirqishni rejalashtirmoqchi bo'lsangiz, ilg'or usuldan foydalanishingiz mumkin. E'tibor bering, agar siz HTML haqida biron bir ma'lumotga ega bo'lsangiz, asbob bilan ishlash ancha osonlashadi. Aytaylik, vaqtni ketma-ketlik ma'lumotlari asosida arxivga ega bo'lgan manbadan ma'lumotlarni o'chirib tashlamoqchi edingiz. Bunday holda, agar siz yuqorida tavsiflangan usulni sinab ko'rsangiz, buzilgan ma'lumotlarni olasiz.

Ushbu muammoni hal qilish uchun XPath deb nomlanadigan HTML va XML so'rovlar tilidan foydalanishingiz mumkin. U nima qiladi? XPath har bir tanlov tarkibidagi turli elementlar to'g'risidagi ma'lumotlarni taniydi. Quyida buni qanday amalga oshirish bo'yicha ko'rsatma mavjud.

1. Scraper konsoliga o'ting, chap tomonda siz "XPath" tugmachasini ko'rasiz, ustiga bosing va boshlang'ich jadvalni yig'ishni davom eting.

2. XPath-ni to'g'ri element uchun yozishingiz kerak. Barcha ma'lumotlarni o'z ichiga olgan joriy XPath quyidagi formatda namoyish etiladi: "// div [3] / div [3] / div [2] / div". <div> elementlari kompyuter tomonidan HTML hujjatida tan olinadi.

3. Tanilgan ma'lumotlarni ajratish uchun siz Scraper ustunlaridan foydalanishingiz kerak. Buni amalga oshirish uchun siz mavjud bo'lgan ma'lumotlarning har xil turlarini qidirishingiz kerak. Axlatga tashlagan ma'lumotlarga qarab siz sarlavhalarga ega bo'lishingiz mumkin. Ushbu sarlavhalar har bir ma'lumot to'plami yonida mavjud. Ular teg bilan birga keladi, bu holda <b> teg.

4. Inspect elementidan foydalanib, XPath-ga <b> tegini joylashtiring va qo'shing. Endi siz ushbu birinchi ustunni "sarlavha ustuni" deb belgilashingiz mumkin, chunki unda sarlavhalar ro'yxati keltirilgan. Sizga kerak bo'lgan har bir ustun uchun turli xil XPathlarni yaratishni davom eting.

5. Skretni bosing va kengaytma avtomatik ravishda ma'lumotlarni yig'adi va siz o'rnatgan turli ustunlarga joylashadi.