تريد المساعدة؟ إليك خياراتك:","كرانش بيس","نبذة عنا","شكراً للجميع على الدعم الرائع!","روابط سريعة","برنامج الإحالة","بريميوم","ProxyScrape تجربة متميزة","مدقق الوكلاء عبر الإنترنت","أنواع الوكلاء","الدول الوكيلة","حالات استخدام الوكيل","مهم","سياسة ملفات تعريف الارتباط","إخلاء المسؤولية","سياسة الخصوصية","الشروط والأحكام","وسائل التواصل الاجتماعي","فيسبوك","لينكد إن","تويتر","كورا","برقية","الخلاف","\n © حقوق الطبع والنشر © 2024 - ثيب بي في | بروغسترات 18 | 2812 ميكلين | بلجيكا | ضريبة القيمة المضافة BE 0749 716 760\n"]}
عندما تستخدم البروكسي، فأنت لا تتصل مباشرةً بالخادم الهدف، بل توجه طلبك إلى الخادم الوكيل الذي يقيّمه ويعيد لك الرد. تتمتع البروكسيات بالعديد من الفوائد، مثل إخفاء عناوين IP الحقيقية الخاصة بك، وتجاوز الفلاتر والرقابة وما إلى ذلك. من الصعب أحيانًا إجراء عمليات تجريف الويب المتقدمة
عندما تستخدم البروكسي، فأنت لا تتصل مباشرةً بالخادم الهدف، بل توجه طلبك إلى الخادم الوكيل الذي يقيّمه ويعيد لك الرد. للوكلاء العديد من الفوائد، مثل إخفاء عناوين IP الحقيقية الخاصة بك، وتجاوز الفلاتر والرقابة وما إلى ذلك.
من الصعب في بعض الأحيان إجراء كشط الويب المتقدم بسبب إرسال طلبات متعددة من نفس عنوان IP. ويواجه كاشطو الويب مشكلة شائعة تتمثل في تعرضهم للحظر من قبل المواقع التي يقومون بكشطها. لكن بإمكانهم استخدام العديد من التقنيات لمنع تعرضهم للحظر، مثل
يمكن أن تساعدك أداة تدوير البروكسي في الالتفاف على معظم إجراءات مكافحة الاختراق. يمكنك أيضًا استخدامه لتجاوز أي حدود للمعدل المطبقة على الموقع الإلكتروني المستهدف واستخراج البيانات بنجاح. ولكن ما هو الوكيل الدوار؟ هو بروكسي يقوم بتعيين عنوان IP جديد لكل اتصال من تجمع البروكسي. وهذا يعني أنه يمكنك إرسال 1000 طلب إلى أي عدد من المواقع الإلكترونية عن طريق تشغيل برنامج نصي والحصول على 1000 عنوان IP مختلف.
تساعدك هذه المقالة على فهم كيفية استخدام البروكسيات لتدوير عناوين IP في بايثون.
يمكنك كشط قائمة البروكسيات المجانية وحفظها في ملف نصي باسم list_proxy.txt. يمكنك بعد ذلك اتباع الخطوات التالية لتدوير عناوين IP في Python.
يجب عليك استيراد وحدة طلبات Python النمطية باستخدام الأمر أدناه.
طلبات الاستيراد
إذا لم تكن الوحدة النمطية مثبتة في بيئتك، يمكنك تثبيتها باستخدام الأمر أدناه.
!طلبات التثبيت
يجب عليك إنشاء دالة send_request (إرسال_request) التي ستأخذ معلمتين، أي الجلسة والوكيل. سيكون من الأفضل استخدام وكيل HTTP لأن معظم الوكلاء المجانيين لا يستخدمون بروتوكول HTTPS. سوف نستخدم كتل محاولة الاستثناء لأن معظم البروكسيات المجانية لا تعمل لأنها مدرجة في قائمة الحظر.
def send_request(session, proxy):
try:
response = session.get('http://httpbin.org/ip', proxies={'http': f"http://{proxy}"})
print(response.json())
except:
pass
هنا يأتي القسم الرئيسي من الكود. يجب عليك قراءة ملف list_proxy.txt وحفظه في المتغير المسمى proxyies كما هو موضح أدناه.
إذا __name__ = = "__main____":
مع فتح('list_proxy.txt'، 'r') كملف:
الوكلاء = file.readlines()
عليك استخدام وحدة الطلبات لإنشاء جلسة في بايثون. استخدمنا حلقة للتكرار للتكرار من خلال الوكيل في الشيفرة أدناه. ثم مررنا الجلسة والوكيل إلى دالة send_request.
مع الطلبات.Session() كجلسة
للوكيل في الوكلاء
إرسال_طلب(جلسة، وكيل)
يمكنك تشغيل البرنامج النصي ومشاهدة المخرجات كما هو موضح أدناه. ستحصل على قائمة طويلة من الوكلاء ولكن تذكر أنها لن تعمل.
python rotateproxy.py
سيكون رمزك بالكامل على النحو التالي:
import requests
def send_request(session, proxy):
try:
response = session.get('http://httpbin.org/ip', proxies={'http': f"http://{proxy}"})
print(response.json())
except:
pass
if __name__ == "__main__":
with open('list_proxy.txt', 'r') as file:
proxies = file.readlines()
with requests.Session() as session:
for proxy in proxies:
send_request(session, proxy)
فيما يلي بعض النصائح لتدوير الوكلاء في Python عند استخدام وكيل دوار.
معظم خدمات البروكسي المجانية المتاحة مزدحمة، مما يؤدي إلى أعطال غير متوقعة وتأخيرات محبطة. لذلك، عندما تخطط لاستخدام البروكسيات المجانية، عليك أن تتحقق مما إذا كانت تتوافق مع احتياجاتك في الكشط دون التسبب في أي أعطال كبيرة.
معظم البروكسيات المجانية صالحة لفترة محدودة، لذا يمكنك بناء منطقك الخاص في Python الذي يمكنه تدوير قائمة البروكسيات المجانية الدوارة بعناوين IP العاملة. بهذه الطريقة، لن تحصل على أي انقطاع أثناء كشط الويب.
يجب عليك تجنب استخدام عناوين IP التي تتبع تسلسلًا معينًا أو تنسيقًا متوقعًا مثل الانتماء إلى نفس المجموعة. ذلك لأن معظم أدوات مكافحة الكشط يمكنها بسهولة اكتشاف الطلبات المرسلة من عناوين IP هذه. على سبيل المثال، يجب عليك الامتناع عن استخدام التسلسل التالي لعناوين IP الدوارة لأنها سترفع العلم الأحمر بسرعة.
103.243.132.11
103.243.132.12
103.243.132.13
103.243.132.14
أجهزة تدوير بروتوكول الإنترنت الوكيل المجانية غير آمنة وبطيئة. لذا، فإن استخدامها لن يكون مناسبًا إذا كنت تقوم بمشاريع كشط الويب المتقدمة والواسعة النطاق. باستخدام البروكسيات الممتازة الجيدة، يمكنك الحصول على خدمة عالية الجودة وكشط آلاف صفحات الويب دون التعرض للحظر أو التعطيل.
لاستخدام خدمة بروكسي متميزة، سيكون عليك دفع بضعة دولارات والحصول على مزود خدمة يلبي احتياجاتك في استخراج البيانات ويضمن لك خصوصيتك.
فيما يلي ثلاث فئات رئيسية من الوكلاء على الإنترنت.
وكلاء النخبة هم الخيار الأفضل من بين هذه الوكلاء حيث يمكنهم منع عمليات الكشف وتجاوز القيود. يمكنك فقط إرسال رأس REMOTE_ADDR باستخدام وكيل النخبة مع إبقاء الرؤوس الأخرى فارغة. بهذه الطريقة، يمكنك تحقيق الخصوصية المثلى باستخدام هذه البروكسيات.
من ناحية أخرى، يكشف البروكسي الشفاف عن تفاصيل عنوان IP الخاص بك ويرسل عنوان IP الحقيقي الخاص بك عبر رأس HTTP_VIA ورأس HTTP_X_X_FORWARDED_FOR. لا يكشف الوكيل المجهول عن عنوان IP الفعلي الخاص بك. فهو إما يرسل عنوان IP الخاص بالوكيل أو يتركه فارغاً.
يمكنك استخدام تدوير عناوين IP لتدوير عناوين IP متعددة وتجنب اكتشافها. ومع ذلك، يمكن لبعض تدابير مكافحة الكشط تحديد مثل هذه الأنشطة ومنعك من جمع البيانات. لذلك، تحتاج أيضًا إلى تدوير وكلاء المستخدمين بصرف النظر عن تدوير عناوين IP لزيادة فرص نجاحك.
من السهل إنشاء أداة تدوير بروكسي في Python. يمكنك إنشاء بروكسيات عشوائية ثم بناء منطق لكشط البيانات من المواقع الإلكترونية. بصرف النظر عن مراكز البيانات والوكلاء السكنيين، فإن الفئات الأخرى هي وكلاء النخبة والوكلاء المجهولين والوكلاء الشفافين. وكلاء النخبة هم الخيار الأفضل لأنه من الصعب اكتشافهم من قبل الموقع الإلكتروني المستهدف. يمكنك استخدام البروكسيات المجهولة إذا كنت تريد فقط الحفاظ على خصوصيتك على الإنترنت. وأخيراً، يمكنك استخدام البروكسيات الشفافة، ولكنها تقدم أقل فرصة للنجاح. تأمل هذه المقالة في تقديم معلومات متعمقة وإعطاء أمثلة عن كيفية استخدام البروكسيات لتدوير عناوين IP في بايثون بخطوات ترميز بسيطة