سه شنیه 20 مرداد 1393
براي دريافت اطلاعات جامع در مورد ميکروفرمت ها از چه سايتي مي توان کمک گرفت؟
پاسخ:
 اگر مي خواهيد با ميکرو فرمت ها بطور دقيقتر آشنا شويد مي توانيد به سايت رسمي آن مراجعه کنيد.
سه شنیه 20 مرداد 1393
روش استفاده از کلاسهاي ميکروفرمت به چه روشي مي باشد؟
پاسخ:
مثال زير با استفاده از ميکروفرمت  hCard  و کلاس هاي ديگر به بيان داده ها مي پردازد:
<h1><span class="author vcard">
<img class="photo" src="http://google724.com/google-analysts.com.gif">
<a class="url fn org" title="google724.com" href="http://google724.com/">
google724.com
</a>
</span>
</h1>
همانطور که مي بينيد کدهاي مربوط به ميکروفرمت در لابلاي کدهاي XHTML تعبيه شده اند. اين کدها در واقع همان کدها هستند و چيزي بيش از Subject-Property-Value نيستند.

اگرچه کد کمي پيچيده شده است اما با کمي دقت مي توانيد مفهوم آن را درک کنيد. در اينجا کل اطلاعات در داخل يک المنت بيان شده که اين المنت از کلاس author vcard مي باشد. در داخل اين المنت، باز هم اطلاعات در قالب المنتهايي بيان شده اند که هر يک داراي يک خصيصه class مي باشند که مقدار آن يک کلمه کليدي است که از ميکروفرمت مورد استفاده استخراج شده است. در داخل اين  لينک کلاسي قرار دارد که  اين خصيصه class مقدار  برابر url fn org دارد که مشخص کننده اين است که در اين لينک آدرس اينترني و نام  يک سازمان قرار دارد
 گوگل آن را بصورت يک آرايه با پارامترهاي زير مي بيند
Array
(
[0] => Array
(
[fn] => google 724.com
[photo] => http://google724.com/google-analysts.com.gif
[org] => google 724.com
[url] => http://google724.com/
)

)

بنابراين در واقع در نسخه دوم، اجزاي مختلف داده توسط کلاسهاي مختلفي نشانه گذاري شده اند. اين کلاس ها در داخل ميکروفرمت مورد استفاده، تعريف شده اند.  
سه شنیه 20 مرداد 1393
ميکروفرمت ها (Microformats) چه مي باشند؟
پاسخ:
ميکرو فرمت ها در واقع يکسري مدل داده ساده هستند که هر کدام براي بيان داده هاي يک موضوع خاص ارائه شده اند. بعنوان مثال، موضوع رزومه کاري را در نظر بگيريد. طبيعتا بر روي وب داده هاي زيادي وجود دارد که مربوط به رزومه افراد مختلف مي باشد. طبيعتا هر کس در نحوه انتشار داده هاي رزومه خودش کاملا مستقل عمل کرده و هيچ قاعده خاصي رعايت نشده است. ممکن است افراد مختلف براي بيان تحصيلات، تجربيات، مهارت ها و اطلاعات تماس خود از عبارت ها و کلمات متفاوتي استفاده کنند و اين داده ها را به شکلهاي مختلفي ارائه کنند. ما انسانها، به راحتي مي توانيم اين تنوع عناوين و مفاهيم را مديريت کنيم و اطلاعات مورد نظر خود را از آنها استخراج کنيم. اما اگر مي خواهيم ماشين هم اين داده ها را بخوبي بفهمد و بتواند اطلاعات مختلفي را از آنها استخراج کند، طبيعتا بايد به شکلي اين تنوع و تعدد را مهار کنيم. ميکروفرمت ها در واقع همين کار را مي کنند.
ميکروفرمت هاي مختلفي وجود دارند (توسط يک community خاص از متخصصان وب معرفي مي شوند) که براي مقاصد مختلف تعريف شده اند. بعنوان مثال:
hCalendar: براي بيان داده هاي مربوط به رويدادها (مثلا مي خواهيم برنامه زماني يک کنفرانس را بيان کنيم. اينکه کنفرانس از چه تاريخي تا چه تاريخي برگزار مي گردد. هر جلسه از چه ساعتي تا چه ساعتي؟ ...)
hCard: براي بيان اطلاعات تماس (Contact Information) نظير نام و نام خانوادگي، آدرس، ايميل، شماره تلفن، صندوق پستي
hResume: براي بيان داده هاي مربوط به رزومه کاري و CV
hReview: براي بيان review ها. مثلا يک سايت که به ارائه اطلاعات گوشي هاي تلفن همراه مي پردازد، ممکن است اين امکان را براي کاربرانش فراهم کند که به review گوشي هاي مختلف بپردازند و نظرات خود را در مورد گوشي ها اعلام کنند. خوب اين اطلاعات مي تواند در قالب ميکروفرمت hReview در صفحات آن سايت نمايش داده شود.
هر کدام از اين ميکروفرمت ها يک مجموعه مشخص و استاندارد از کلمات يا بهتر بگويم، يک مجموعه از کلاسها را براي بيان اجزاي مختلف داده ارائه مي کنند.
سه شنیه 19 مرداد 1393
روش کار تکنولوژي RFDa چگونه است؟
پاسخ:

متد RDFa مخفف Resource Description Framework in Attributes به معناي چارچوب توصيف منابع در خصوصيت ها است. اين متد يک تکنيک است که يک نوع فرمت serialization براي افزودن داده هاي ساختاريافته به صفحات HTML به صورت مستقيم تعريف مي کند. اين تکنيک توسط W3C از سال 2004 تحت توسعه است. مديران سايت ها مي توانند داده ها را براي ماشين ها نظير مرورگر ها و ساير برنامه ها قابل خواندن سازند که از طريق خصوصيت هاي تگ هاي HTML انجام مي شود. آنها مي توانند آيتم هاي ساده صفحه مانند عنوان و آيتم هاي پيچيده صفحه مانند يک شبکه اجتماعي کامل در صفحات وب را نشان گذاري کنند.
در اين روش از فرهنگ لغات متفاوتي مي توان استفاده کرد. هر فرهنگ لغت (vocabulary) حاوي تعدادي اصطلاح (term) است. مديران سايت ها مي توانند به اين اصطلاح ها در محتواي وب اشاره کنند تا نوع هر قسمت از محتواي صفحه را مشخص کنند. فرهنگ لغت Dublin Core تعداد زيادي اصطلاح را تعريف کرده است که مي توانيد آنها را در آدرس http://purl.org/dc/terms بيابيد. تعداد بيشتري از فرهنگ لغت ها در وب وجود دارند. براي مثال مي تواند از فرهنگ FOAF براي ارائه اطلاعات در مورد اشخاص استفاده کرد. روش RDFa از آدرس هاي اينترنتي براي ارجاع به اصطلاح ها استفاده مي کند زيرا با اين روش مطمئن مي شود که اگر فرهنگ لغت هاي ديگري اصطلاح هاي مشابهي را تعريف کرده باشند، راه مشخص و واضحي براي تمايز بين اين اصطلاح ها وجود داشته باشد.

سه شنیه 19 مرداد 1393
روش وب معنايي (semantic web) چيست؟
پاسخ:

اين روش براي ساده کردن استخراج داده ها براي خزنده هاي وب به کار مي رود. مديران سايت ها بايد داده هاي ساختاريافته را به صورتي که توسط ماشين ها قابل فهم باشد به صفحات اضافه کنند. آنها بايد نشانه هاي اضافي در صفحه قرار دهند تا راهنمايي براي يافتن داده هاي ساختاريافته باشد. بنابراين همانطور که محتواي وب براي انسان ها قابل استفاده است، برنامه هاي کامپيوتري به خوبي آنها را مي فهمند. در نهايت اين برنامه ها مانند موتورهاي جستجوگر، بيشتر براي مردم مفيد خواهند بود.

سه شنیه 19 مرداد 1393
معايب استخراج داده ها از صفحات موجود در وب چيست؟
پاسخ:

در اين راه بايد صفحات وب را به همان صورتي که هستند، قبول کنيم. اين يعني صفحات وب داده هاي ساختاريافته را در خود به صورتي غير قابل خواندن براي ماشين نمايش دهند و خزنده هاي وب مجبور باشند اين داده ها را در همين وضعيت استخراج کنند. بعضي از تحقيقات روي چنين روش هايي تمرکز دارند. آنها مي خواهند مقاديري که احتمالا در ديتابيس ها ذخيره شده اند را به صورت اتوماتيک از صفحات وبي که بر اساس يک قالب (template) درست شده اند يا از درون جداول (table) ها و ليست هاي HTML استخراج کنند. اين تحقيقات در حوزه ديتابيس و هوش مصنوعي (AI) هستند که براي حل مسئله استخراج داده ها از صفحات وب فعاليت دارند. اين روش به منابع و الگوريتم هاي پيچيده اي نياز دارد و با چالش هاي تکنيکي مواجه است:
o استخراج داده ها دشوار است
o داده ها معمولا به صورت آشفته و پراکنده هستند

سه شنیه 19 مرداد 1393
تکنولوژي هاي غني سازي صفحات وب با داده ساخت يافته به چه منظور مي باشد؟
پاسخ:

تعداد فزاينده اي از مردم براي يافتن اطلاعات در وب، موتورهاي جستجوگر را به کار مي گيرند. آنها به موتور هاي جستجوگري نياز دارند تا اطلاعات مرتبط با آنچه را که مي خواهند، در زمان کوتاهي در اختيارشان بگذارد. موتور هاي جستجوگر کنوني در وب، بر اساس کلمات کليدي کار مي کنند. اين موتور هاي جستجوگر بايد کلمات، عبارات و جملات را از ميليون ها صفحه وب استخراج و ايندکس کنند. بعضي اوقات مردم اطلاعات نامرتبطي را از جستجوهايشان دريافت مي کنند. سايت ها و نرم افزار هاي تحت وب، داده هاي ساختاريافته (structured data) را که در ديتابيس هاي رابطه اي ذخيره شده اند، به يک فرمت بدون ساختار که در صفحات وب موجود است، تبديل مي کنند. موتورهاي جستجوگر بايد چنين صفحاتي را بررسي کنند. استخراج داده هاي ساختاريافته اوليه از چنين صفحاتي، کار مشکلي است. روشهاي RDFa، Microformats، Microdata براي افزودن داده هاي ساختاريافته به صفحه وجود دارد به طوري که آنها را قابل خواندن توسط ماشين يا موتورهاي جستجوگر کند.

  صفحه1از1