Proxies are the simple tools you can use to compile your data from the web and boost your business without fearing being blocked or banned. A proxy is an intermediary between your computer and the website you visit. A website can identify you by your Internet Protocol (IP) address when you don’t use a proxy
الوكلاء هم الأدوات البسيطة التي يمكنك استخدامها لتجميع بياناتك من الويب وتعزيز عملك دون خوف من الحظر أو الحظر. الوكيل هو وسيط بين جهاز الكمبيوتر الخاص بك وموقع الويب الذي تزوره. يمكن لموقع الويب التعرف عليك من خلال عنوان بروتوكول الإنترنت (IP) الخاص بك عندما لا تستخدم خادما وكيلا. يضيف استخدام الوكيل طبقة إضافية بين جهاز الكمبيوتر الخاص بك وموقع الويب. أولا ، تتصل بالخادم الوكيل الذي يخفي عنوان IP الخاص بك ويعرض عنوانا مختلفا على موقع الويب.
بعض حالات الاستخدام الواسع النطاق للوكلاء هي:
بعض الوكلاء لا يعملون بسبب العديد من القيود. عند محاولة الاتصال بالإنترنت، تحصل على رسالة مهلة. ذلك لأن الوكلاء إما بطيئون جدا أو غير موجودين. هنا تأتي الحاجة إلى مدقق وكيل. يمكنك توفير الوقت باستخدام مدقق وكيل لاختبار الوكلاء الخاص بك. يساعدك على فحص الوكلاء بكميات كبيرة. عند استخدام بروكسيات مجانية ، يجب أن تعلم أنها تغلق دون اختيار لحظة. لذلك ، عليك أن تبقي مدقق الوكيل في متناول يدك. سيكون عليك استخدامه يوميا للتحقق من الوكلاء الذين يعملون.
فيما يلي بعض النصائح التي تحتاج إلى اتباعها لاستخدام مدقق الوكيل.
دعونا نرى كيف يمكننا إنشاء مدقق وكيل في Python بمساعدة الخطوات التالية.
تحتاج إلى استيراد المكتبتين التاليتين ، أي ،
استيراد urllib.request ، مقبس
socket.setdefaulttimeout(180)
هنا ، تحدد وحدة urllib.request الفئات والوظائف التي تساعد في فتح عناوين URL في العالم المعقد. يمكن أن تكون عناوين URL إما سلسلة أو كائن طلب .
من ناحية أخرى ، يساعد المقبس في توصيل عقدتين على الشبكة للتواصل مع بعضهما البعض. يمكنك استيراد مكتبة المقابس وإنشاء مقبس بسيط وبدء الاتصال ثنائي الاتجاه. يقوم setdefaulttimeout() بتعيين المهلة الافتراضية للمقابس الجديدة.
يجب عليك قراءة قائمة IP الوكيل في proxyList كما هو موضح أدناه.
قائمة الوكلاء = ['140.82.61.218:8080']
يمثل السطر أعلاه من التعليمات البرمجية نموذج IP للوكيل.
للتحقق مما إذا كانت الوكلاء تعمل أم لا ، يجب عليك تحديد وظيفة كما هو موضح أدناه.
def is_bad_proxy(pip):
try:
proxy_handler = urllib.request.ProxyHandler({'http': pip})
opener = urllib.request.build_opener(proxy_handler)
opener.addheaders = [('User-agent', 'Mozilla/5.0')]
urllib.request.install_opener(opener)
sock=urllib.request.urlopen('http://www.google.com')
except urllib.error.HTTPError as e:
print('Error code: ', e.code)
return e.code
except Exception as detail:
print( "ERROR:", detail)
return 1
return 0
هنا
للعنصر في قائمة الوكيل:
إذا is_bad_proxy (البند):
طباعة ("وكيل سيئ" ، عنصر)
آخر:
طباعة (عنصر، "يعمل")
تكتشف الدالة is_bad_proxy() الوكلاء العاملين في قائمة IP للوكيل.
في الكود أعلاه ، تتكرر حلقة for عبر proxyList. نحصل على نتيجة "وكيل سيئ" إذا كان الوكيل لا يعمل.
هناك العديد من الاستخدامات لمدقق الوكيل. ويرد بعضها أدناه.
ProxyScrape هو واحد من مزودي البروكسي الأكثر شعبية وموثوقية على الإنترنت. تتضمن ثلاث خدمات بروكسي خوادم بروكسي مخصصة لمركز البيانات وخوادم بروكسي سكنية وخوادم بروكسي متميزة. إذن ، ما هو أفضل حل ممكن لأفضل وكيل HTTP؟ قبل الإجابة على هذه الأسئلة ، من الأفضل رؤية ميزات كل خادم وكيل.
يعد وكيل مركز البيانات المخصص هو الأنسب للمهام عالية السرعة عبر الإنترنت ، مثل دفق كميات كبيرة من البيانات (من حيث الحجم) من خوادم مختلفة لأغراض التحليل. إنه أحد الأسباب الرئيسية التي تجعل المؤسسات تختار وكلاء مخصصين لنقل كميات كبيرة من البيانات في فترة زمنية قصيرة.
يحتوي وكيل مركز البيانات المخصص على العديد من الميزات ، مثل النطاق الترددي غير المحدود والاتصالات المتزامنة ، وبروكسيات HTTP المخصصة لسهولة الاتصال ، ومصادقة IP لمزيد من الأمان. مع وقت تشغيل بنسبة 99.9٪ ، يمكنك أن تطمئن إلى أن مركز البيانات المخصص سيعمل دائما خلال أي جلسة. أخيرا وليس آخرا ProxyScrape يوفر خدمة عملاء ممتازة وسيساعدك على حل مشكلتك في غضون 24-48 ساعة عمل.
التالي هو وكيل سكني. السكنية هي وكيل الانتقال لكل مستهلك عام. السبب الرئيسي هو أن عنوان IP الخاص بالوكيل السكني يشبه عنوان IP الذي يوفره مزود خدمة الإنترنت. هذا يعني أن الحصول على إذن من الخادم الهدف للوصول إلى بياناته سيكون أسهل من المعتاد.
الميزة الأخرى ل ProxyScrapeالوكيل السكني هو ميزة دوارة. يساعدك الوكيل الدوار على تجنب الحظر الدائم على حسابك لأن الوكيل السكني الخاص بك يغير عنوان IP الخاص بك ديناميكيا ، مما يجعل من الصعب على الخادم الهدف التحقق مما إذا كنت تستخدم وكيلا أم لا. إنها أداة رائعة لتجريف الويب.
بصرف النظر عن ذلك ، فإن الميزات الأخرى للوكيل السكني هي: عرض النطاق الترددي غير المحدود ، إلى جانب الاتصال المتزامن ، وبروكسيات HTTP / s المخصصة ، والوكلاء في أي جلسة زمنية بسبب 7 ملايين بالإضافة إلى الوكلاء في تجمع الوكيل ، ومصادقة اسم المستخدم وكلمة المرور لمزيد من الأمان ، وأخيرا وليس آخرا ، القدرة على تغيير خادم البلد. يمكنك تحديد الخادم الذي تريده عن طريق إلحاق رمز البلد بمصادقة اسم المستخدم.
آخر واحد هو الوكيل المتميز. الوكلاء المتميزون هم نفس وكلاء مراكز البيانات المخصصين. تظل الوظيفة كما هي. الفرق الرئيسي هو إمكانية الوصول. في الوكلاء المميزين ، يتم توفير قائمة الوكيل (القائمة التي تحتوي على بروكسي) لكل مستخدم على ProxyScrapeشبكة. هذا هو السبب في أن الوكلاء المتميزين يكلفون أقل من وكلاء مراكز البيانات المخصصة.
إذن ، ما هو أفضل حل ممكن لأفضل وكلاء HTTP؟ الجواب سيكون "وكيل سكني". السبب بسيط. كما ذكر أعلاه ، فإن الوكيل السكني هو وكيل دوار ، مما يعني أنه سيتم تغيير عنوان IP الخاص بك ديناميكيا على مدار فترة زمنية يمكن أن يكون مفيدا لخداع الخادم عن طريق إرسال الكثير من الطلبات في إطار زمني صغير دون الحصول على كتلة IP.
بعد ذلك ، سيكون أفضل شيء هو تغيير الخادم الوكيل بناء على البلد. يجب إلحاق ISO_CODE البلد في نهاية مصادقة IP أو مصادقة اسم المستخدم وكلمة المرور.
ناقشنا أن الوكلاء هم وسطاء بين العميل والخادم. يمكن أن تعمل الخوادم الوكيلة كجدار حماية ، وتوفر اتصالات شبكة مشتركة ، وبيانات ذاكرة التخزين المؤقت لتسريع الطلبات الشائعة. يمكننا استخدام مدقق وكيل لاختبار وكلائنا لمعرفة أيها يعمل. قبل استخدام مدقق الوكيل ، نحتاج إلى التحقق من السرعة والموقع. علاوة على ذلك ، يمكننا إنشاء مدقق وكيل في Python عن طريق استيراد المكتبات الضرورية وتحديد وظيفة مدقق الوكيل التي تحدد طبيعة الوكيل ، وظيفية أو غير وظيفية.
آمل أن تكون قد تعرفت على كيفية إنشاء مدقق وكيل في بايثون.