تعداد نشریات | 43 |
تعداد شمارهها | 1,686 |
تعداد مقالات | 13,791 |
تعداد مشاهده مقاله | 32,383,276 |
تعداد دریافت فایل اصل مقاله | 12,792,022 |
معرفی نرمافزار جدید CheckName با کاربرد در تجمیع و افزایش دقت و صحت فهرستهای فلوریستیک | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
تاکسونومی و بیوسیستماتیک | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
مقاله 11، دوره 6، شماره 20، آذر 1393، صفحه 111-122 اصل مقاله (1.27 M) | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
نویسنده | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
مجید شریفی تهرانی* | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
گروه زیستشناسی، دانشکده علوم، دانشگاه شهرکرد، شهرکرد، ایران | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
چکیده | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
دقت و صحت نامهای علمی در فهرستهای فلوریستیک لازمه اعتبار نتایج و کاربرد صحیح آنها در سیستمهای نرمافزاری برای رسیدن به سطح بالاتری از دانش فلوریستیک است. بررسی حاضر، نرمافزار متن باز CheckName را معرفی نموده و آن را در اختیار پژوهشگران قرار میدهد. این نرمافزار دارای فهرستی از نامهای علمی گیاهان کشور است که از تجمیع، تصحیح و خالصسازی فهرستهای فلوریستیک منتشر شده در ایران حاصل شده و برای کمک به تجمیع و تصحیح فهرستهای فلوریستیک منتشر نشده موجود در کشور یا ایجاد فهرستهای جدید توسط نرمافزار CheckName مورد استفاده قرار میگیرد. در تهیه فهرستهای فلوریستیک جدید، نامهای علمی از فهرست نامهای گیاهان ایران انتخاب میشوند و نرمافزار عمل افزودن آتوریتی و منبع پروتولوگ به نامها و تهیه فهرست را انجام میدهد. در تصحیح فهرستهای فلوریستیک موجود، پس از ورود فهرست به برنامه، چنانچه اشتباه نگارشی در آن وجود داشته باشد، تصحیح میشود و هر سطر از فهرست به اجزای آن تجزیه و صحیح بودن نامهای علمی در سطح جنس و گونه بررسی میشود. برای موارد تأیید نشده، نامهای صحیح احتمالی پیشنهاد میشود. کاربردهای دیگر این نرمافزار شامل برقراری ارتباط آنلاین با پایگاههای IPNI، NCBI، TROPICOS و PubMed و دریافت اطلاعات مرتبط با هر نام اشاره نمود. | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
کلیدواژهها | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
دقت؛ صحت؛ فهرست فلوریستیک؛ پایگاه داده؛ بررسی نام | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
اصل مقاله | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
مقدمه.بررسی فلور و پوشش گیاهی یک منطقه به دلیل انواع کاربرد از دادهها و اطلاعات آن، (مثلاً کاربرد در مطالعات اساسی در زمینه اکولوژی و مدلسازی الگوهای پراکندگی تنوع گونهای) اهمیت فراوانی دارد (Heywood, 1995). اهمیت مطالعه و ارزیابی تنوع زیستی (شامل معرفی فلور و پوشش گیاهی مناطق)، نهادها و برنامههای بینالمللی متعددی را برای تسهیل و تشویق چنین مطالعاتی در دنیا ایجاد نموده است (نظیر: UNEP، IUBS، UNESCO و CITES). امروزه در کشورهای صنعتی و پیشرفته، بررسی فلور و پوشش گیاهی یک منطقه به عنوان یک پیش شرط و لازمه احداث هرگونه صنایع با اهداف اقتصادی، نظامی، فرهنگی، صنایع ساختمانی و مانند آن مطرح است که میبایست در چارچوب قوانین و مقررات موجود در کشورها در زمان و مکان صحیح انجام گیرد؛ و این مطالعات بنا به مورد، به عنوان یک پایش دایمی تکرار میشوند. دقت در صحیح بودن روش مطالعه (روشهای تعیین سطح مورد مطالعه، اندازه نمونه، تعداد نمونه و توزیع نقاط نمونهبرداری در سطح مورد مطالعه) و در نهایت، صحیح بودن یافتهها (معتبر بودن نامهای علمی و صحیح بودن املای آنها) در فهرستهای فلوریستیک منتشر شده از اهمیت زیادی برخوردار است و برای تبادل اطلاعات میان مراکز تحقیقاتی، ارایه گزارشهای علمی و امکان مقایسه میان مناطق مختلف ضرورت دارند (Phillips et al., 2003). بررسی مقایسهای فهرستهای فلوریستیک، تجمیع دادهها و ارایه گزارش های معتبر، مستلزم ابزارهای کارآمد و قابل اعتماد برای کنترل دقت و صحت دادهها است (Sharifi-Tehrani and Rahiminejad Ranjbar, 2013). دسترسی جامعه علمی به چنین کیفیتی از دادهها و اطلاعات، امکان انجام فراتحلیل (متاآنالیز) یافتههای پیشین را فراهم میسازد. با پیشرفت تدریجی پروژه پایگاه داده فلوریستیک ایران (iHerbs database)، امکان بررسی سابقه و وضعیت کنونی مطالعات فلوریستیک در کشور ایران فراهم شده است. فهرستی از نامهای علمی گیاهانی که در دهههای اخیر طی مطالعات فلوریستیک مختلف در کشور ایران جمعآوری شدهاند، تهیه شده و امکان انجام برخی تحلیلها میسر گردیده است. وجود اشتباههای نگارشی و استفاده از نامهای علمی که دیگر معتبر نیستند، در مقالات منتشر شده آشکار گردیده است، بنابراین ثبت صحیح دادهها در پایگاه داده، مستلزم ابزاری برای تضمین دقت (precision) و صحت (certitude) و اعتبار (validity) دادهها است. در فقدان دسترسی به یک پایگاه داده تاکسونومیک که علاوه بر کاربردهای اصلی بتوان از آن برای تولید فهرستهای فلوریستیک استفاده کرد یا آن را برای ارزیابی خودکار و اعتبارسنجی فهرستهای فلوریستیک موجود برنامهریزی نمود، معرفی نرمافزاری که دسترسی سریع و مؤثر به پایگاههای بینالمللی برای کنترل نامهای علمی را فراهم کند و به تهیه فهرستهای فلوریستیک کمک نماید و صحیح بودن املای نامهای در فهرستهای از پیش تهیه شده را کنترل نماید، از اهمیت فراوانی برخوردار است و از طریق مشارکت عمومی در تصحیح و تجمیع دادهها، مقدمهای برای رسیدن به پایگاه داده فلوریستیک ملی تلقی میشود. ایجاد یک پایگاه داده بهروز شونده تاکسونومیک برای ایجاد ارتباط با پایگاه داده فلوریستیک ملی، چیزی است که جامعه علمی کشور (در زمینه فلور، پوشش گیاهی، منابع طبیعی و محیط زیست) به آن نیاز دارد (Sharifi-Tehrani and Rahiminejad Ranjbar, 2013). طراحی، اجرا، بهروزرسانی مداوم و ارایه خدمات متنوع به جامعه علمی کشور مسلتزم همکاری گروهی از علاقمندان به موضوع و مشارکت افراد خبره است. دسترسی جامعه علمی کشور به چنین ابزارهایی، روند تحقیقات در زمینه فلوریستیک را متحول خواهد ساخت. اهمیت و نوآوری بررسی حاضر در معرفی نرمافزاری متن باز (open source) است که قابلیت توسعه توسط پژوهشگران علاقمند را دارد. نام علمی گونههای گیاهی که در این نرمافزار کوچک قرار داده شده است، حاصل تجمیع یافتههای تعداد زیادی از محققان طی بیش از دو دهه مطالعات فلوریستیک در ایران است (بیش از 170 مطالعه فلوریستیک طی سالهای 1368 تا 1393)
مواد و روشها. تعداد 8700 نام علمی جنس و گونه (شامل 7970 نام در سطح گونه)، متعلق به گیاهانی که طی سالهای 1386 تاکنون در مطالعات فلوریستیک مختلف در ایران از آنها نام برده شده است، با استفاده از تجمیع دادهها در پایگاه داده iHerbs |(Sharifi-Tehrani and Rahiminejad Ranjbar, 2013) استخراج شد و به منظور توسعه یک نرمافزار متن باز به نام CheckName مورد استفاده قرار گرفت. طراحی نرمافزار مذکور در محیط میکروسافت اکسس 2013 نسخه 64 بیتی تحت ویندوز 7 نسخه 64 بیتی صورت گرفت. ارتباط با پایگاههای IPNI، NCBI، TROPICOS و PubMed با استفاده از نشانی اینترنتی (URL) که ارتباط با پایگاههای IPNI و TROPICOS را فراهم میسازند، صورت گرفت IPNI, 2013)؛ (TROPICOS, 2013. اجرای مرورگر اینترنت، تشخیص نام جنس و تفکیک آن از صفت گونهای، تنظیم نشانی اینترنتی و ارسال خط دستور، با استفاده از زبان برنامهنویسی VBA در محیط میکروسافت اکسس صورت گرفت (Utley, 2002). دو فیلد متنی هر یک به اندازه 255 کاراکتر در جدول Binomials برای ذخیره اطلاعات دریافتی از پایگاهها جهت استفاده آفلاین در نظر گرفته شد. تعداد فیلدها توسط محققان قابل افزایش است. نرمافزار CheckName از طریق مکاتبه با نگارنده قابل دریافت است.
نتایج و بحث. بررسی چندین مقاله علمی موردی (انتخاب چند فهرست فلوریستیک به صورت تصادفی) نشان داد که تعداد نامهای علمی دارای اشتباه املایی در یک فهرست فلوریستیک منتشر شده، ممکن است تا 30 درصد تعداد نامهای در همان فهرست باشد (جدول 1). این در حالی است که وجود اشتباههای نگارشی در فهرستهای فلوریستیک مانعی جدی برای استفاده مؤثر از آنها است. بررسی بیش از 36000 رکورد ثبت شده در پایگاه داده iHerbs قبل و بعد از تصحیح نامها نشان داد که در مجموع، 13 درصد نامها دارای ایراد نگارشی هستند. همچنین انتخاب تصادفی تعدادی از فهرستهای فلوریستیک و انجام بررسی مشابه، نشان داد که در مقایسه با مجلات غیر ایرانی که مطالعات فلوریستیک ایران را منتشر نمودهاند، مجلات ایرانی تعداد فهرستهای فلوریستیک به مراتب بیشتر و از نظر صحیح بودن نامهای علمی، فهرستهای به مراتب صحیحتری را منتشر نمودهاند. جدول 1 نشان میدهد که هیچ یک از سه مجله غیر ایرانی که به طور تصادفی در این بررسی ارزیابی شدهاند، بالاتر از سطح میانگین (حاصل از فهرست تجمیع شده از 36000 رکورد) نیستند. این نتایج، اعتبار و صحت بیشتر یافتههای علمی منتشر شده در مجلات داخل کشور را برای مطالعات فلوریستیک ایران نشان میدهد. بنابراین، به نظر میرسد برطرف شدن حدود 5/7 درصد (میانگین) اشتباههای نگارشی در نامهای علمی منتشر شده در فهرستهای فلوریستیک (مجلات داخلی) را میتوان با استفاده از یک نرمافزار میسر نمود.
جدول 1- تعداد و درصد نامهای علمی دارای ایراد نگارشی در بررسی موردی 12 فهرست فلوریستیک. N: تعداد نامهای در فهرست فلوریستیک، G: تعداد نامهایی که بخش جنس آنها اشتباه نگارشی داشتند، B: تعداد نامهایی که اشتباه نگارشی داشتند، Gx و Bx: بر حسب درصد. سطرهای جدول بر اساس ستون آخر سمت راست (درصد نامهای دارای ایراد نگارشی) مرتب شدهاند.
شایان ذکر است که نامهای علمی ذخیره شده در جدول اصلی نرمافزار CheckName (جدول Binomials) الزاماً همگی مربوط به گیاهان ایران نیستند، چرا که در اغلب مطالعات فلوریستیک انجام شده در ایران به طور دقیق معلوم نشده که نمونههای کدام جنسها یا تیرهها توسط کدام یک از منابع موجود مورد شناسایی قرار گرفتهاند، بنابراین، احتمال ثبت تعدادی از نامهای علمی برخی گیاهان مناطق همجوار (فلور ترکیه، شوروی، پاکستان، ...) که در ایران نمیرویند وجود دارد. در مقابل، بر اساس گزارشهای دریافت شده از پایگاه داده iHerbs جنسهای متعددی نیز وجود دارند که در منابع فلور به آنها اشاره شده اما در هیچ یک از مطالعات فلوریستیک دو دهه اخیر نامی از گونههای آنها آورده نشده است. بنابراین، فهرست نامهای علمی گونهها در این نرمافزار (جدول Binomial) یک فهرست نسبتاً کامل (و نه دقیقاً کامل) محسوب میشود. برای رفع این کاستی (که حتی برای یک فهرست کامل نیز به زودی مطرح میگردد) نرمافزار به صورت متن باز ارایه میشود تا امکان تصحیح و تکمیل فهرست نامهای علمی توسط سایر پژوهشگران وجود داشته باشد. کاربردهای اصلی برنامه CheckName عبارتند از: الف) ارتباط نرمافزار با پایگاههای IPNI، NCBI، TROPICOS و PubMed جهت ارسال و دریافت اطلاعات به طور خودکار؛ عملکرد بخشهای مختلف برنامه در ادامه به طور اختصار توضیح داده شدهاند و توضیحات بیشتر به صورت یک راهنما همراه برنامه ارایه میگردد. .ارتباط با پایگاههای تاکسونومیک برای دریافت اطلاعات:نرمافزار CheckName از یک پنجره اصلی (شکل 1) و فهرستی از نامهای علمی گیاهان ایران که در جدول “Binomials” وارد شدهاند، تشکیل شده است. پس از اجرای برنامه، علامت نشانگر به طور پیشفرض در کادر “Select”قرار میگیرد. این کادر یک فهرست بازشونده است و با نوشتن در آن، نخستین نام علمی نزدیک به حروف تایپ شده نمایش داده میشود. با باز کردن فهرست، سایر نامهای نزدیک به آن به ترتیب الفبایی مشاهده میشوند. این فهرست دارای بیش از 7800 نام علمی از گونههای گیاهی ایران است. با انتخاب هر یک از نامها در کادر “Type in” درج میشود تا برنامه بتواند از آن نام استفاده نماید. در این کادر میتوان نامهایی که در فهرست “Select” وجود ندارد را به جای انتخاب، نوشت. با استفاده از دستور "افزودن نام جدید" (شکل 1-A) میتوان نامهای جدید را به جدول “Binomial” افزود. همچنین ویرایش نامهای موجود منتخب از کادر “Select” با دستور "ویرایش" (شکل 1-B) صورت میگیرد. با استفاده از دستور “IPNI” (شکل 1-C) نام موجود در کادر “Type in” به پایگاه IPNI در نشانی http://www.IPNI.org ارسال و نتیجه در مرورگر اینترنت قابل مشاهده میگردد (شکل 2). این عمل با سرهم کردن یک نشانی اینترنتی (URL) که ارتباط با پایگاه را ممکن و نام علمی را به آن ارسال میکند، صورت میگیرد (برای جزییات به مستندات نرمافزار مراجعه نمایید). پایگاه IPNI رکوردهای متناظر با نام علمی را از سه منبع: نمایه کیو (IK)، نمایه هاروارد (GCI) و نمایه نامهای گیاهی استرالیا (APNI) بر اساس انتخاب کاربر ارایه مینماید (Berendsohn, 1997). به طور مشابه، استفاده از دستور “TROPICOS” نام انتخاب شده را به پایگاه TROPICOS در نشانی http://www.TROPICOS.org ارسال و نتیجه را در مرورگر اینترنت قابل مشاهده مینماید (شکل 3). پایگاه TROPICOS در مواردی که اعتبار یک نام (پروتولوگ) مشخص شده باشد، با علایم مختلفی که در شکل 3 نشان داده شده است، آن را اعلام میکند. دستورهای “Nucleotide/Protein”و “NCBI” برای ارسال نام علمی مورد نظر به پایگاههای بانک ژن (http://www.ncbi.nih.gov/Taxonomy) و PubMed |.(http://www.ncbi.nlm.nih.gov/ pubmed) مورد استفاده قرار میگیرند. .افزودن نامهای جدید به فهرست، ویرایش و افزودن توضیحات: افزودن اطلاعات بیشتر به یک نام، با انتخاب نام مورد نظر از فهرست “Select”، درج آن در کادر “Type in” و استفاده از دستور ویرایش (شکل 1-B) انجام میشود. افزودن نامهای جدید به انتهای فهرست نیز با استفاده از دستور "افزودن" (شکل 1-A) صورت میگیرد. افزودن اطلاعات دریافت شده از پایگاههای IPNI و TROPICOS به نامهای موجود با استفاده از این دستور، مفید است، زیرا دسترسی به این اطلاعات را در حالت آفلاین نیز میسر می سازد. پیش از افزودن یک نام جدید به انتهای جدول برنامه، بررسی صحیح بودن نام از طریق ارتباط با پایگاههای IPNI و TROPICOS ضروری است، زیرا فهرست “Binomials” محور قابلیتهای اصلی برنامه محسوب میشود و صحیح بودن نامهای آن فرض اصلی است. تهیه فهرست از نامهای علمی: دستورهای “Append”، “Bookmark” و “Show List” برای تهیه فهرستهای فلوریستیک بدون نیاز به نوشتن به کار میروند. دستور “Append” نام انتخابی در کادر “Type in” )شکل 1) را به انتهای یک فهرست فلوریستیک در نشانی c:\mylist.txt میافزاید (اگر این فهرست وجود نداشته باشد، از نو ایجاد میگردد). نرمافزار CheckName به طور خودکار نام مؤلف و در صورت وجود، اطلاعات به دست آمده از IPNI را به نام انتخاب شده اضافه میکند. دستور “Bookmark” انتهای فعلی فهرست را با یک عبارت که از کاربر گرفته میشود، علامتگذاری میکند (شکل 4). این دستور برای جدا کردن قسمتهایی از فهرست یا یادآوری محلی از فهرست کاربرد دارد. علایم ایجاد شده با دستور “Bookmark” پس از تکمیل فهرست باید توسط خود محقق حذف شوند. دستور “Show List” محتوای فعلی فایل فهرست فلوریستیک را در برنامه ویرایش متن ویندوز باز میکند. در این مرحله، امکان حذف و تغییر نامهای انتخابی محقق و در صورت لزوم، افزودن شناسه به سطر اول فایل وجود دارد. .بررسی املای نامهای علمی در فهرستهای از پیش نگارش شده:بررسی صحیح بودن املای نامهای علمی در فهرستهای موجود به اندازه تهیه فهرستهای جدید اهمیت دارد. ورود دادهها از فایلهای اکسل یا فایلهای متنی ساده صورت میگیرد. فرض بر این است که در یک فهرست فلوریستیک، در هر سطر از فایل یک نام علمی (یک Binomial و ملحقات آن) وجود دارد. نرمافزار CheckName قالبهای بسیار متنوعی از اسامی علمی را شناسایی میکند و قادر است فهرستهایی را که در آنها به طور مرسوم از خلاصهنویسی استفاده شده است، تکمیل نماید. بنابراین، نام جنس میتواند به صورت مخفف نوشته شده باشد یا زیرگونهها، واریتهها و شکلهای مختلف یک گونه، در سطرهای زیرین آن بدون ذکر نام گونه ذکر شده باشند. نرمافزار CheckName وجود نام مؤلف به دنبال هر بخش از نام را بررسی میکند و در تجزیه یک سطر از فایل ورودی، کاملاً هوشمندانه عمل مینماید. فهرستهایی که Import میشوند به طور خودکار تحلیل و به فرمت جدولهای پایگاه داده تبدیل میشوند و میتوان محتوای آنها را با دستور “View the List” (شکل 1) مشاهده نمود. ورود فهرست به برنامه از طریق ورود فایلهای ساده متنی (شکل 1-D) یا فایلهای اکسل (شکل 1-E) امکانپذیر است. برای ورود فهرست به نرمافزار از طریق فایل اکسل رعایت ترتیب دادهها در ستونهای اکسل اهمیت دارد (به مستندات نرمافزار مراجعه شود). نرمافزار هر یک از نامهای علمی را به اجزای آن تجزیه مینماید و اجزای اصلی نام (جنس و گونه) را با فهرست نامهای علمی گیاهان ایران که در داخل نرمافزار وجود دارد، مقایسه و در صورت صحیح بودن نام نتیجه را به صورت “Name is Correct” (در مقابل هر نام) اعلام مینماید. چنانچه فقط بخش جنس صحیح باشد عبارت “Genus is Corrct” نمایش داده میشود.
شکل 1- پنجره اصلی نرمافزار CheckName. A: افزودن یک نام علمی (Binomial)؛ B: ویرایش یک نام علمی؛ C: اتصال به پایگاه IPNI؛
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
مراجع | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
منابعBerendsohn, W. G. (1997) A taxonomic information model for botanical databases: the IOPI model. Taxon 46: 283-309. Heywood, V. H. (1995) Global biodiversity assessment. Cambridge University Press, Cambridge. IPNI, The International Plant Names Index. Retrieved from http://www.ipni.org. On: 14 August 2013. Phillips, O. L., Vasquez, M. R., Nunez, V. P., Monteagudo, L. A., Zans, M. E. C., Sanchez, W. G., Cruz, A. P., Timana, M., Yli-Halla, M. and Rose, S. (2003) Efficient plot-based floristic assessment of tropical forests. Journal of Tropical Ecology 19: 629-645. Sharifi-Tehrani, M. and Rahiminejad Ranjbar, M. R. (2013) Compilation of floristic and herbarium specimen datain Iran: proposal to data structure. Taxonomy and Biosystematics 5(15): 75-94 (in persian). TROPICOS, Botanical Information System at the Missouri Botanical Garden. Retrieved from http://www.tropicos.org. On: 14 August 2013. Utley, C. (2002) The programmer's introduction to Visual Basic, NET. Sams publishing, Indianapolis.
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
آمار تعداد مشاهده مقاله: 798 تعداد دریافت فایل اصل مقاله: 348 |