الجواهر للمعلوماتية الجواهر للمعلوماتية
recent

آخر الأخبار

recent
جاري التحميل ...

خوارزمية تحليل و تفكيك نص

موضوع الخوارزمية


في هذه المقالة نتطرق إلى خوارزمية تحليل وتفكيك نص مكتوب وبرمجتها بلغة Python ، النص يكون بأي لغة ، لكن في هذه المقالة نأخذ نص مكتوب باللغة الإنجليزية كالمثال التالي :

Sharks are found in deep and shallow waters throughout the world's
        . oceans, with some migrating vast distances to breed and feed

الجواهر للمعلوماتية

الهدف من تفكيك النص هو معرفة عدد حروفه وعدد كلماته والأحرف الهجائية الموجودة وعدد تكرارها في النص.
النص ينتهي بنقطة ، أما الفرغات والفواصل فهي تفرق بين الكلمات في النص الواحد.


خوارزمية تحليل وتفكيك نص


نريد وضع خوارزمية مناسبة للمسألة المذكورة سابقا ، بحيث نتحصل على عدد الكلمات الموجودة في النص وعدد الأحرف الموجودة فيه .

1- الثوابت والمتغيرات أي مدخلات ومخارج الخوارزمية
  - المتغير الأول هو النص ونرمز له ب text
  - المتغير الثاني هو عدد كلمات النص نرمز له ب totword
  -  المتغيرالثالث هو عدد أحرف النص نرمز له ب totletter
  - المتغير الرابع يحتوي على الحرف المقروء من النص نرمز له ب char
  - المتغير الخامس هو العداد يرمزله ب counter
  - المتغير السادس طول النص long

2- الإجراءات والعمليات
  - حساب طول النص text  وهي دالة في لغة Python تعطي long
  - يقرأ الحرف char من النص text إذا كان لايساوي . أو ، أو ؟ أو ! أو " " فإنه يضاف 1  إلى totletter  ويضاف 1 إلى counter
  - أما إذا كان الحرف المقروء char يساوي  . أو ، أو ؟ أو ! أو " " فإنه يضاف 1 إلى        totword و يضاف 1 إلى counter
  - يعاد تكرار هذه العمليات حتى يصبح counter يساوي long

3- النهاية أو مخرجات الخوارزمية
    تكتب عدد الكلمات الموجودة في النص وكذلك عدد الأحرف موجودة فيه.

   وتكون الخوارزمية على الشكل التالي :


عالم المعرفة للتقنية والمعلوماتية

برنامج الخوارزمية بلغة Python


عالم المعرفة للتقنية والمعلوماتية

ويمكنك تطوير هذا البرنامج ليحتوي على كثير من التفكيكات والتحليلات ، كما يمكنك تغيير بعض الكلمات في النص أو يمكنك تشفيره بالكامل بطريقة بسيطة جدا.

التعليقات


جميع الحقوق محفوظة

الجواهر للمعلوماتية