تعداد نشریات | 43 |
تعداد شمارهها | 1,652 |
تعداد مقالات | 13,415 |
تعداد مشاهده مقاله | 30,626,414 |
تعداد دریافت فایل اصل مقاله | 12,112,087 |
مقایسۀ عملکرد شبکههای عصبی خودسازماندۀ مکانی و غیرمکانی در خوشهبندی دادههای اجتماعی-اقتصادی بلوکهای آماری شهر اصفهان | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
جغرافیا و برنامه ریزی محیطی | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
مقاله 7، دوره 34، شماره 4 - شماره پیاپی 92، دی 1402، صفحه 111-132 اصل مقاله (2.73 M) | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
نوع مقاله: مقاله پژوهشی | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
شناسه دیجیتال (DOI): 10.22108/gep.2023.137707.1582 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
نویسندگان | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
هادی تاریقلی زاده1؛ بابک میرباقری* 2؛ علی اکبر متکان3 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
1دانشجوی دکتری سنجش از دور و GIS، مرکز مطالعات سنجش از دور و GIS، دانشکدۀ علوم زمین، دانشگاه شهید بهشتی، تهران، ایران | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
2استادیار مرکز مطالعات سنجش از دور و GIS، دانشکدۀ علوم زمین، دانشگاه شهید بهشتی، تهران، ایران | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
3استاد مرکز مطالعات سنجش از دور و GIS، دانشکدۀ علوم زمین، دانشگاه شهید بهشتی، تهران، ایران | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
چکیده | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
امروزه با افزایش حجم و ابعاد دادههای مکانی و نیاز به درک کامل دادهها، شبکههای عصبی خودسازمانده به ابزاری استاندارد برای کار با دادههای بزرگ و چندبُعدی تبدیل شدهاند که میتوانند در خوشهبندی، بصریسازی و انتقال دادههای چندبُعدی در فضایی با ابعاد کمتر استفاده شوند. هدف از پژوهش حاضر، خوشهبندی دادههای بلوکهای آماری (شامل ده متغیر منتخب اجتماعی-اقتصادی مرتبط با رویکرد توسعۀ پایدار شهری) با شبکههای عصبی خودسازمانده بدون استفاده از پارامترهای مکانی و بهکارگیری مختصات جغرافیایی بلوکهای آماری بهعنوان پارامتر مکانی در روند خوشهبندی و مقایسۀ نتایج حاصلشده، است. الگوریتم SOM رایجترین شبکۀ عصبی خودسازمانده و الگوریتم Geo-SOMمکانیشدۀ الگوریتم SOM است. روند خوشهبندی هر دو الگوریتم یکسان است و تنها تفاوت این دو الگوریتم بهکارگیری پارامترهای مکانی در روند اجرای الگوریتم Geo-SOM است. در پژوهش حاضر دادهها با الگوریتم SOM و Geo-SOM خوشهبندی شده است. نتایج نشان داد که خوشههای حاصل از دو الگوریتم بهطور کامل، متفاوت است. خوشهبندی بلوکهای آماری بدون توجه به خصوصیات مکانی و تنها با استفاده از معیار شباهت، منجر به خوشههای ناهمگن میشود و برعکس. با اعمال پارامترهای مکانی نهتنها از معیار شباهت، از ویژگیهای مکانی دادهها نیز در فرآیند خوشهبندی استفاده میشود که این مسئله منجر به تولید خوشههای همگن میشود. ارزیابی نتایج با استفاده از ضریب سیلهوته بیانگر خوشهبندی مناسبتر الگوریتم Geo-SOM است؛ بهطوری که میانگین ضریب سیلهونه برای الگوریتم SOM برابر 02/0- و برای الگوریتم Geo-SOM برابر 27/ 0است. مقایسۀ نتایج نشاندهندۀ تأثیر مثبت پارامترهای مکانی در خوشهبندی دادههای اجتماعی و اقتصادی است. | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
کلیدواژهها | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
شبکههای عصبی خودسازمانده؛ Geo-SOM؛ خوشهبندی؛ دادههای مکانی؛ بلوکهای آماری؛ شهر اصفهان | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
اصل مقاله | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
مقدمه در سالهای اخیر میزان دادههای مکانی دردسترس بهشدت افزایش یافته است. برای درک کامل دادههای مکانی لازم است دانشی ساده و عمومی از دادههای مکانی با درنظرگرفتن خصوصیات ویژۀ مکان استخراج شود. به فرآیند شناسایی الگوهای معتبر، جدید، مفید و قابل فهم در دادهها «کشف دانش در پایگاه داده» (KDD) (Knowledge Discovery in Database) گفته میشود (Fayyad, Piatetsky-Shapiro, & Smyth, 1996). کشف دانش جغرافیایی (GKD) (Geographic Knowledge Discovery) بهمعنای کشف دانش از روابط بین پدیدههای جغرافیایی است که زیرمجموعۀ KDD است. یک مؤلفۀ اصلی در این فرآیند دادهکاوی مکانی (SDM) (Spatial Data Mining) است که الگوها و روابط ناشناخته را در پایگاه دادههای مکانی کشف میکند (Klösgen & Zytkow, 1996). باتوجه به اهمیت و نیاز گسترده به دانش استخراجشده از دادههای مکانی میتوان گفت که 1- دادههای با ابعاد بالا میتواند برای تفسیر و تجزیهوتحلیل چالشبرانگیز باشد؛ 2- میزان محاسبات با ابعاد دادهها در ارتباط و تجزیهوتحلیل دادههای با ابعاد بالا ازنظر محاسباتی پرهزینه است؛ 3- روابط این دادههای با ابعاد بالا بهراحتی قابل تجسم نیست. خوشهبندی یکی از روشهای استاندارد برای کار با مجموعه دادههای بزرگ است؛ زیرا حجم دادهها را با یکیکردن دادههای مشابه در گروهها (خوشهها) کاهش میدهد؛ بهطوری که تفاوت داخلی دادهها بهطور چشمگیری، کمتر از تفاوتهای بین خوشهای میشود (Andrienko et al., 2010). خوشهبندی ازطرفی، یکی از اساسیترین مسائل یادگیریِ ماشینۀ نظارتنشده و از طرف دیگر، روشی مفید در استخراج دانش از دادههای مکانی است که هدف اصلی آن تفکیک دادهها در خوشههایی با ویژگیهای مشابه است (Jain, Murty, & Flynn, 1999). ساختار دادهها با خوشهبندی سازماندهی و تجزیهوتحلیل و اکتشاف دادهها تسهیل میشود. دادههای مکانی اغلب خودهمبستگی مکانی (Spatial Autocorrelation) دارند که یک مفهوم اساسی در علوم مکانی است (Sui, 2004) و بدین معناست که پدیدههای نزدیک شباهتهای بیشتری نسبت به پدیدههایی دارند که از یکدیگر فاصله دارند (Tobler, 1970). خوشهبندی مکانی، سازماندهی اشیا مکانی در خوشههاست؛ بهگونهای که اشیا داخل یک خوشه نهتنها ازنظر ویژگیهای اشیا، ازنظر مکانی نیز به یکدیگر مشابه هستند و با اشیا داخل خوشههای دیگر تفاوت دارند (Miller, 2010). الگوریتم خوشهبندی دادههای مکانی، دراساس با دادههای غیرمکانی متفاوت است (Grubesic, Wei, & Murray, 2014). یک ویژگی اساسی دادههای مکانی این است که مشاهدهها بیشتر وابسته به مکان است (Sui, 2004). اگر دادههای مکانی با نادیدهگرفتن وابستگی مکانی خوشهبندی شوند، ممکن است منجر به خوشهبندی نامناسب دادهها شوند (Openshaw, 1999). محققان به الگوریتمهای خوشهبندی مکانی در طی سالیان توجه کردهاند؛ زیرا تعداد الگوریتمهایی که وابستگی مکانی را در روند دادهها لحاظ کردهاند، محدود است. دادهکاوی مکانی با بهکارگیری شبکههای عصبی مصنوعی (ANN) (Artificial Neural Networks) و پایگاه دادههای مکانی (Spatial Database)، الگوها و روابط ناشناخته در دادهها را کشف میکند تا اطلاعات را استخراج و درنهایت، آنها را به دانش جدید و بالقوه مفید تبدیل کند (Yuan et al., 2004). مفهوم ANN از زمان معرفی اولیه در دهۀ 1980 میلادی گسترش و تنوع زیادی یافته است؛ بهطوری که امروزه به یکی از حوزههای بسیار فعّال پژوهشی تبدیل شده است. با افزایش حجم و ابعاد دادهها و نیاز به توان محاسباتی بالا و دقیق، شبکههای عصبی مصنوعی به ابزاری استاندارد برای حل مسائل خوشهبندی و طبقهبندی تبدیل شدهاند. یکی از انواع شبکههای عصبی مصنوعی، نقشۀ خودسازمانده (Self-Organizing Map) (SOM) است که کوهونن در آغاز دهۀ1980 میلادی پیشنهاد کرد Kohonen, 1995)). الگوریتم SOM میتواند برای خوشهبندی، بصریسازی و انتقال دادههای چندبُعدی در فضایی با ابعاد کمتر استفاده شود (Stefanovic & Kurasova, 2018). نقشۀ خودسامانده (SOM) متداولترین و رایجترین الگوریتم برای خوشهبندی دادهها با ابعاد بالا و یا چندبُعدی است (Galutira, Fajardo, & Medina, 2019). الگوریتم SOM یک شبکۀ عصبی بدون نظارت است که دادههای با ابعاد بالا یا چندبُعدی را در یک فضای تکبُعدی، دوبُعدی و در مواردی خاص سهبُعدی به نام نقشه نگاشت میکند (Wankhede, 2014). عنصر اصلی الگوریتم SOM رقابت انعطافپذیر گرهها در لایۀ خروجی است که در هر تکرار، گره برنده نهتنها بهروز میشود، همسایگان آن نیز تعدیل میشود. شبکۀ SOM میتواند بهگونهای تنظیم شود که دادههای گروهی و کلاسهای بهنسبت مشابه با یکدیگر را شناسایی کند (Sheela & Deepa, 2012). باکائو، لوبو و پاینهو الگوریتم Geo-SOM را در سال 2005 معرفی کردند که انطباقیافتۀ الگوریتم SOM و مبتنی بر فرآیند یادگیری رقابتی است و جنبه مکانی دارد؛ زیرا جستوجو را به مجاورت جغرافیایی الگوهای ورودی محدود میکند (Bação, Lobo, & Painho, 2004; Hagenauer & Helbich, 2016). مهمترین مزیت دو الگوریتم SOM و Geo-SOM درمقایسه با سایر روشهای دادهکاوی این است که این الگوریتمها نهتنها نتیجه را بهصورت برآوردهای عددی (بیشتر روشهای دادهکاوی) به دست میآورند، نتیجه را بهصورت بصری نیز ارائه میکنند (Stefanovic & Kurasova, 2011). بصریسازی به محققان اجازه میدهد تا خوشهها و روابط بین دادهها را ببینند و نتایج خوشهبندی را تحلیل و تفسیر کنند (Zhang & Fang, 2012).
پیشینۀ پژوهش پژوهشهای متعدّدی در موضوعات مختلف برای خوشهبندی با استفاده از الگوریتمهای SOM انجام شده است. Hagenauer & Helbich, 2016) (پژوهشی با عنوان « SPAWNNابزاری برای تحلیل فضایی با شبکههای عصبی خودسازمانده» انجام دادهاند. محققان با بهکارگیری الگوریتمهای CNG (Contextual Neural Gas) و Geo-SOM دادههای اجتماعی-اقتصادی بلوکهای سرشماری سال 2010 میلادی را در ایالات متحده با متغیرهای قومیت، سن، مسکن و خانوارهای شهر شیکاگو خوشهبندی کردند. نتایج پژوهش بینشهای مهمی را دربارۀ ویژگیهای اجتماعی-اقتصادی شهر شیکاگو نشان داد که این شهر بهدلیل تنوع اجتماعی-اقتصادی با تفکیک شدید قومیتی در سراسر مناطق شهری مواجه است. لی و همکاران در پژوهشی با عنوان «استفاده از نقشۀ خودسازماندهی برای طبقهبندی کیفیت آب ساحلی: بهسوی درک بهتر الگوها و فرآیندها» الگوریتم SOM را برای طبقهبندی کیفیت آبهای ساحلی به کار بردند. در این پژوهش برای بررسی ویژگیهای فضایی کیفیت آب در ناحیۀ ساحلی فوجیان، 19 متغیر کیفی آب در ۹۴ محل نمونهبرداریشده بررسی شد. در این پژوهش برای نشاندادن الگوهای متغیرهای کیفیت آب از صفحات مؤلفۀSOM (Component Planes) استفاده شد که در آن الگوهای مشابهی برای متغیرهایی که با یکدیگر در ارتباط بودند، مشاهده شد که نشاندهندۀ یک منبع مشترک بود. نتایج نشان داد که الگوریتم SOM یک ابزار مؤثر برای درک بهتر الگوها و فرآیندهای محرک کیفیت آب است .(Li et al., 2018) لیائو وهمکاران در پژوهشی با عنوان «کاوش پایگاه داده یک بررسی محیطی خاک با استفاده از یک نقشۀ جغرافیایی خودسازماندهی: یک مطالعۀ آزمایشی» الگوریتم SOM را برای خوشهبندی پایگاه دادۀ زیستمحیطی خاک به کار بردند. مجموعه دادهها با روش نمونهبرداری منظم شبکهایی از 5 فلز سنگین و نمونههای خاک نیز از 5 عنصر متنوع با چولگی بالا تشکیل شده بود. As و Pb الگوی توزیع سطحی و صفحات مؤلفۀ مشابهی داشتند که نشاندهنده همبستگی بالای این دو عنصر است؛ به این معنا که آنها در محیط خاک نیز رفتار مشابهی دارند .(Liao et al., 2019) بررسی مطالعات پیشین نشاندهندۀ عملکرد مناسب شبکههای عصبی خودسازمانده در خوشهبندی دادههاست. در این مطالعات محققان باتوجه به اهمیت دادهکاوی و دانش بهدستآمده از تحلیل دادهها و تواناییهای الگوریتمهای شبکههای عصبی در دادهکاوی، جنبههای مختلف الگوریتمهای شبکههای عصبی خودسازمانده را بررسی کردهاند. کمیسیون جهانی محیطزیست و توسعه (World Commission on Environment and Development) (WCED) مفهوم توسعۀ پایدار را بهعنوان توسعهای که نیازهای نسل حاضر را بدون به خطر انداختن توانایی نسلهای آینده برای برآوردن نیازهای خود مرتفع میکند، تعریف کرده است (Aldegheishem, 2014). پایداری شهری شامل ابعاد فیزیکی، اقتصادی و فرهنگی است (Rodrigues & Franco, 2020). هدف اصلی توسعۀ پایدار، تأمین نیازهای اساسی، بهبود و ارتقای سطح زندگی برای همه، حفظ و ادارۀ بهتر اکوسیستمها و آیندهای امنتر و سعادتمند است. توسعۀ پایدار شهری فرآیندی است که طی آن گردش انرژی در شهر در شرایط حداقلی عملکردی، بیشترین کارایی را دارد و توزیع یکسانی را در به حرکت در آوردن عناصر بهعنوان یک مجموعۀ یکپارچه و متصل ایجاد میکند (تقوایی و صفرآبادی، 1392). باوجود مزایای فراوان بهکارگیری شبکۀ عصبی خودسازمانده در خوشهبندی دادههای با ابعاد بالا و قدرت تفسیرپذیری آن، بررسی پیشینۀ پژوهش نشان میدهد که در پژوهشهای داخلی به استفاده از الگوریتمهای فوق در خوشهبندی دادههای اجتماعی-اقتصادی مرتبط با توسعۀ پایدار شهری توجه نشده است؛ بنابراین در پژوهش حاضر سعی بر آن است که علاوهبر استفاده از شبکههای عصبی خودسازمانده برای خوشهبندی دادههای اجتماعی-اقتصادی مرتبط با توسعۀ پایدار شهری، عملکرد دو الگوریتم SOM و Geo-SOM در خوشهبندی دادههای فوق نیز مقایسه شود.
منطقۀ مطالعهشده کلانشهر اصفهان سومین شهر پرجمعیت ایران با طول جغرافیایی 54 درجه و ۳۹ دقیقه و ۴۰ ثانیۀ شرقی و عرض جغرافیایی ۳5 درجه و ۳۸ دقیقه و ۳۰ ثانیۀ شمالی است. این کلانشهر 15 منطقۀ شهرداری دارد و بیشترین تراکم جمعیت آن بهترتیب متعلق به مناطق 8 و 10 است. این مناطق در سالهای گذشته رشد فراوانی داشته که باعث افزایش تراکم آنها شده است. همچنین، در مناطق 1 و 2 که درواقع، بخش مرکزی شهر اصفهان را تشکیل میدهند، بهعلت قدمت بافت و تخریب فضای مسکونی، تراکم جمعیت آنها نسبت به متوسط تراکم کل مناطق بسیار کمتر شده است. شکل 1 مناطق پانزدهگانۀ شهر اصفهان را به همراه بلوکهای آماری و آمار جمعیتی آنها نمایش میدهد.
دادههای پژوهش دادههای استفادهشده در پژوهش حاضر، دادههای بلوکهای آماری سرشماری جمعیت سال 1395 کلانشهر اصفهان است که مرکز آمار ایران ارائه کرده است. تعداد کل بلوکهای آماری با جمعیت، برابر 13362 عدد است که متغیرهای متعدّد اجتماعی-اقتصادی دارد. در این متغیرها بلوکهای آماری براساس ویژگیهایی چون جمعیت کل، سطح تحصیلات، فعالیتهای اجتماعی-اقتصادی و ویژگی ساختمانها توصیف میشود. همانطور که پیشتر نیز اشاره شد، هدف از پژوهش حاضر خوشهبندی بلوکهای جمعیتی براساس متغیرهای اقتصادی-اجتماعی مرتبط با توسعۀ پایدار شهری است. براساس مرور پژوهشهای صورتگرفته دربارۀ متغیرهای مرتبط با توسعۀ پایدار شهری، 10 متغیر برای خوشهبندی بلوکهای آماری انتخاب شد که عبارت است از: تراکم جمعیت در فضا (سپهوند و عارفنژاد، 1392)، نسبت جمعیت متأهل (موسوی، 1397)، تعداد مهاجران واردشده (احمدی، حسینیفر و نصیری هندخاله، 1395)، میزان اشتغال (توده فلاح و همکاران، 1397)، نسبت جمعیت جوان (Lez’er et al., 2019)، متوسط مساحت واحد مسکونی (نصیری دارانی، 1401)، تعداد واحد مسکونی آپارتمانی (محمدزاده، 1394)، میزان استحکام بنا (Patel & Patel, 2021)، نسبت باسوادی (برقی، 1397) و نسبت محصلان (نصیری دارانی، 1401). بر این اساس، ستونهای مرتبط با متغیرهای دهگانۀ فوق از دادههای بلوکهای آماری انتخاب و درصورت لزوم نسبت آنها به جمعیت کل برای هر بلوک جمعیتی محاسبه شده است. درنهایت، متغیرهای محاسبهشده برای هممقیاسسازی و ورود به الگوریتمهای لازم براساس میانگین و انحراف معیار استانداردسازی شد. در پژوهش حاضر علاوهبر متغیرهای فوق از مختصات جغرافیایی مراکز هندسی بلوکهای آماری نیز بهعنوان پارامتر مکانی استفاده شده است.
شکل 1: نقشۀ شهر اصفهان به تفکیک مناطق و بلوکهای آماری (منبع: نویسندگان 1402) Figure 1: Regions and Census Blocks of Isfahan City
روششناسی پژوهش در پژوهش حاضر از دو الگوریتم SOM و Geo-SOM برای خوشهبندی دادههای اجتماعی-اقتصادی بلوکهای آماری استفاده و نتایج حاصل با یکدیگر مقایسه شده است.
الگوریتم نقشههای خودسازمانده (SOM) نقشۀ خودسازمانده یک شبکۀ پیشخور تکلایه است که در آن نورونهای خروجی در یک ساختار توپولوژیکی با ابعاد کم مرتب شده است. با الگوریتم SOM دادههای با ابعاد بالا به نقشههای ویژگی دوبُعدی شبکۀ نگاشت میشوند (شکل2). نقشههای خودسازمانده سعی میکند که در مرحلۀ نگاشت، روابط توپولوژیکی را حفظ کند؛ یعنی الگوهایی را که در فضای ورودی نزدیک به یکدیگر هستند به واحدهایی که در فضای خروجی نزدیک هستند، نگاشت میکند و برعکس. برای نگاشت به هر نورون یک بردار وزنی برابر با ابعاد فضای ورودی وجود دارد؛ یعنی هر واحد i یک بردار وزنی متناظر با بُعد d wi={wi1, wi2,…..,wid} دارد. ابعاد فضای ورودی بهطور معمول، از ابعاد شبکۀ خروجی بیشتر است. بیشتر الگوریتمهای SOM در یک شبکۀ مستطیلی از واحدها پیادهسازی میشوند. ایدۀ اصلی این است که درطول آموزش، هر داده با تمام واحدها مقایسه و شبیهترین آنها که بهعنوان بهترین واحد تطبیق (Best Matching Unit) (BMU) شناخته میشود، انتخاب شود. سپس BMU و همسایگان آن در شبکه بهروزرسانی شوند تا به آن دادۀ خاص نزدیکتر شوند. درحین نگاشت تنها یک نورون برنده وجود خواهد داشت و آن نورونی است که بردار وزنی آن نزدیکترین فاصله را با بردار ورودی داشته باشد که با محاسبۀ فاصلۀ اقلیدسی بین بردار ورودی و بردار وزنی تعیین میشود. روند اصلی آموزش شبکههای عصبی خودسازمانده بهصورت زیر است (Kohonen, 1995).
رابطۀ (1) ام جزء بردار ورودی است و پیوند وزنی در نورون واقع در ( ) است.
رابطۀ (2) فاصلۀ اقلیدسی نورون کمترین مقدار باشد.
رابطۀ (3)
برای همگرایی و ثبات نقشه، میزان یادگیری و شعاع همسایگی در هر تکرار کاهش مییابد؛ بنابراین همگرایی به سمت صفر میل خواهد کرد.
شکل 2: دیاگرام الگوریتم SOM (منبع: نویسندگان 1402) Figure 2: Diagram of Self-Organizing Map Algorithm
الگوریتم Geo-SOM الگوریتم Geo-SOM توزیع واحدهای SOM را نهتنها باتوجه به شباهت بین همسایگان، باتوجه به تراکم جغرافیایی بردارهای ورودی نیز ایجاد میکند (Bação et al., 2004). در الگوریتم آموزشی SOM، مهمترین مرحله در تعیین اینکه کدام الگوها با یکدیگر خوشهبندی شوند، مرحلۀ انتخاب بهترین واحد تطبیق (BMU) است؛ بنابراین با تغییر نحوۀ انتخاب BMU میتوان به مختصات جغرافیایی اهمیت بیشتری داد. در الگوریتم Geo-SOM برای قراردادن BMU در مجاورت جغرافیایی الگوی ورودی، فرآیند جستوجوی انتخاب بهترین واحد تطبیق (BMU) در دو مرحله انجام میشود. در مرحلۀ اول، همسایگی جغرافیایی که امکان جستوجو برای BMU در آن وجود دارد، انتخاب و در مرحلۀ دوم با استفاده از سایر متغیرها جستوجوی نهایی انجام میشود. این همسایگی جغرافیایی با پارامتر k (حد آستانۀ جغرافیایی: Geographic Tolerance) که در فضای خروجی نقشۀ SOM تعریف شده است، کنترل میشود (شکل 3). در حالت ، الگوریتم نزدیکترین واحد را ازلحاظ جغرافیایی بهعنوان BMU انتخاب میکند. با تنظیم k برابر با اندازۀ نقشۀ SOM، مختصات جغرافیایی نادیده گرفته میشود. وقتی است مکانهای نهایی بردارها در فضای ورودی بهطور تقریبی، متناسب با مکانهای جغرافیایی بردارهای آموزشی خواهد بود (Bação et al., 2004).
شکل 3: دیاگرام الگوریتم Geo-SOM (منبع: نویسندگان 1402) Figure 3: Diagram of Geo-SOM Algorithm
ابزارهای بصریسازی در الگوریتم SOM و Geo-SOM برای تجزیهوتحلیل خروجی الگوریتمهای SOM و Geo-SOM از ابزارهای بصریسازی (Visualization) متعدّدی استفاده میشود که عبارت است از:
ماتریسU (U- Matrix) یک راه بهنسبت ساده برای شناسایی خوشههای SOM و Geo-SOM استفاده از ماتریس U (ماتریس فاصلۀ یکپارچه) (Unified Distance Matrix) است. توپولوژی پیشفرض نقشههای خودسازمانده، ششضلعی است. این ششضلعیها، مکان نورونها و روابط همسایگی آنها را با نورونهای دیگر در توپولوژی شبکه نشان میدهد که ماتریس U نامیده میشود. فاصلۀ بین گرههای همسایه در ماتریس U باتوجه به فاصلۀ اقلیدسی وزندار میشوند و با رنگ روی نقشه ترسیم میشوند (Löhr et al., 2010). رنگهای سردتر (آبی) نورنهای همسایه را که نزدیک هستند (شباهت دارند) نشان میدهد و رنگهای داغتر (قرمز) نورنهای همسایه را که فاصلۀ زیاد دارند (متفاوت هستند)، نشان میدهد. سرانجام، میتوان گفت در ماتریس U گرههای با فاصلۀ کم به یک خوشه تعلق دارند و گرههای با فاصلۀ زیاد مرزهای خوشههای مختلف را نشان میدهند (Park et al., 2018). بنابراین با استفاده از ماتریس U میتوان نتایج خوشهبندی شبکه را تحلیل و ارزیابی کرد.
صفحات مؤلفهها (Component Planes) صفحۀ مؤلفه، وزن نسبی هریک از مؤلفههای (متغیرهای) بردارهای ورودی را بهطور جداگانه، نشان میدهد (Kohonen, 1995). تعداد صفحات مؤلفهها در هر الگوریتم SOM وGeo-SOM برابر با اندازۀ ابعاد دادۀ ورودی است؛ بنابراین برای هر متغیر از بردار ورودی یک صفحۀ مؤلفه وجود دارد (در این پژوهش 10 صفحه برای الگوریتم SOM و 12 صفحه برای الگوریتم Geo-SOMایجاد میشود). وزنهای هریک از بردارهای ورودی را میتوان با استفاده از صفحۀ مؤلفه بصریسازی کرد. در این صفحات، رنگهای روشنتر و تیرهتر بهترتیب نشاندهندۀ وزنهای بزرگتر (نگاشتشدن متغیرهایی با مقدارهای بیشتر) و کوچکتر (نگاشتشدن متغیرهایی با مقدارهای کمتر) است. با مقایسۀ صفحات مؤلفه میتوان الگوهای اتصال و ارتباط مؤلفهها را با یکدیگر بررسی کرد. اگر صفحات مؤلفهها با یکدیگر مشابه باشد، بردارهای ورودی همبستگی بالایی دارند و برعکس. صفحات مؤلفه را میتوان براساس شاخص شباهت آنها مقایسه و متغیرهای مشابه و با همبستگی و غیرمشابهِ بدون همبستگی را از یکدیگر جدا کرد (Löhr et al., 2010).
Hits Map Hits Maps نقشۀ مفید دیگری است که نشان میدهد یک نورون شبکه بهعنوان BMU چند بار انتخاب شده است و یا به عبارت دیگر، چند دادۀ ورودی به هر نورون نگاشت شده است. همچنین، با این نقشه میتوان توزیع بردارهای ورودی را درسطح نورونهای شبکه بررسی کرد که بهتر است دادهها بهطور یکنواخت، در سراسر نورونهای شبکه توزیع شده باشد (Kassambara, 2017).
نقشۀ خوشهها (Clusters Map) در الگوریتم SOM بهطور معمول، تعداد نورونها بسیار بیشتر از تعداد خوشههای واقعی است. در این الگوریتم تعداد تقریبی خوشهها را میتوان با استفاده از ماتریس U و براساس فاصلههای میان نرونها تعریف کرد. گفتنی است در اینجا منظور از نقشۀ خوشهها نقشهای مبتنی بر ماتریس U است که در آن شمارۀ خوشه برای هر نورون تعیین شده باشد. براساس این نقشه میتوان نقشۀ جغرافیایی بلوکهای آماری را تولید کرد که در آن برای هر بلوک، شمارۀ خوشۀ مربوط به آن مشخص شده باشد.
اندازۀ نقشه اندازۀ نقشه (تعداد نورونهای خروجی) برای اجرای SOM حیاتی است؛ با این حال هیچ قانون دقیقی برای تعیین اندازۀ نقشه وجود ندارد. الهونیمی و وسانتو در سال 2000 میلادی روشی پیشنهاد کردند که تعداد بهینۀ نورونها نزدیک به است (n تعداد نمونههای مطالعهشده است). اگر این فرض صحیح باشد، اندازۀ بهینۀ نقشه در مطالعۀ حاضر باید برابر با 578 نورن باشد که عدد بزرگی است. آزمونهای متعدّد در پژوهش حاضر نشان داد اگر اندازه نقشۀ خیلی کوچک باشد، خوشهها تفکیکناپذیر میشوند یا اگر خیلی بزرگ باشد، نهتنها خوشهها تفکیکپذیر نخواهند بود، در بعضی از نورونها نیز بردار ورودی نگاشت نمیشود؛ بنابراین اگر اندازۀ نقشه باتوجه به ابعاد دادهها و تعداد متغیرهای مطالعهشده پس از بررسی اندازههای مختلف انتخاب شود، تفکیک خوشهها دقیقتر و بهتبع آن در همۀ نورونها بردار ورودی نگاشت خواهند شد. در پژوهش حاضر پس از بررسی اندازههای مختلف، نقشهای به اندازۀ 49 نورون یا شبکه (7*7) انتخاب شد .(Vesanto & Alhoniemi, 2000) ارزیابی نتایج خوشهبندی در پژوهش حاضر برای ارزیابی نتایج خوشهبندی از ضریب سیلهوته (Silhouette) استفاده شد. این ضریب برای یک خوشه، درجۀ شباهت دادههای داخل یک خوشه و شباهتنداشتن با خوشههای دیگر را اندازهگیری میکند (Kaufman & Rousseeuw, 2009). این ضریب برای هر نمونه، هر کلاس و مجموعه کل دادهها محاسبه میشود. ضریب سیلهوته براساس دوری و نزدیکی نمونهها و خوشهها به یکدیگر و با استفاده از رابطۀ 4 قابل محاسبه است. رابطۀ (4)
در این رابطه مقدار ضریب سیلهوته محاسبهشده برای نمونۀ است. در این رابطه میانگین عدم تشابه (Dissimilarity) بین مشاهدۀ با سایر مشاهدهها در یک خوشۀ مشابه و کمینۀ میانگین عدم تشابه مشاهدۀ نسبت به تمام مشاهدهها در خوشههای دیگر است. براساس رابطۀ فوق مقدار بین 1- و 1+ قرار دارد. اگر به 1+ نزدیکتر باشد، به این معناست که خوشۀ پیشنهادشده برای نمونۀ لازم مناسب و چنانچه به 1- نزدیکتر باشد، به این معناست که خوشۀ پیشنهادشده برای نمونۀ لازم نامناسب است. کیفیت کلی خوشهبندی را میتوان با استفاده از میانگین ضریب سیلهوته برای کل مجموعه داده اندازهگیری کرد که براساس رابطۀ 5 تعریف میشود. رابطۀ (5)
در این رابطه تعداد کل نمونههاست و مقدار بالاتر نشاندهندۀ خوشهبندی مناسب است (Hsu & Li, 2010).
یافتههای پژوهش و تجزیهوتحلیل ماتریس U ششضلعیهای حاوی اعداد در این ماتریس نشاندهندۀ مراکز نورونهای شبکه است. همچنین، این اعداد نشان میدهد که نورونهای برندهشده متعلق به کدام خوشه است. همانطور که اشاره شد، توپولوژی شبکه در این مطالعه، پس از بررسی اندازههای متعدّد ماتریس U برای شناسایی خوشهها، 7 در 7 انتخاب شده است؛ بنابراین 49 نورون در شبکه وجود دارد. همانطور که اشاره شد، فاصلۀ بین نورنهای متعلق به یک خوشه کمتر از فاصلۀ بین نورنهای متعلق به خوشههای دیگر است. باتوجه به آنچه در شکل 4 آمده است، فاصلۀ بین نورنهای متعلق به خوشۀ 4، در ماتریس U الگوریتم SOM با ششضلعیهای آبی پررنگ و فاصلۀ این نورنها با نورنهای خوشههای دیگر با ششضلعیهای روشنتر زرد یا قرمز مشخص شده است. همچنین، فاصلۀ نورنهای متعلق به خوشۀ 10، نسبت به یکدیگر با ششضلعیهای آبی رنگ و با نورنهای متعلق به خوشههای 2 و 5 با ششضلعی زرد و نارنجی رنگ مشخص شده است. تحلیل و بررسی این ماتریسها نشان میدهد که نتایج حاصل از دو الگوریتم SOM و SOM-Geo بهطور کامل، متفاوت است. در ماتریس U الگوریتم SOM بیشتر نورونهای شبکه (23 نورون) در خوشۀ 4 و تعداد 7 نورون در خوشۀ 2 و سایر نورونهای شبکه در خوشههای دیگر دستهبندی شده است. در ماتریس U الگوریتم SOM-Geo بهجزء خوشههای 1، 7، 9 و 10 که به هرکدام یک نورون تعلق دارد، 45 نورون دیگر شبکه در 7 خوشۀ دیگر دستهبندی شده است. تفاوت اصلی این دو الگوریتم در نحوۀ نگاشت بردارهای ورودی در نورونهای شبکه است که این تفاوت نیز منجر به دستهبندی متفاوت نورونهای شبکه در خوشههای هر دو الگوریتم میشود؛ برای مثال، بردارهای ورودی نگاشتشده در قسمت بالا و سمت چپ نورونهای شبکۀ SOM باید ویژگیهای بهطور تقریبی، مشابهی داشته باشند تا در خوشۀ 4 دستهبندی شوند؛ درحالی که در همین بخش از نورونهای شبکۀ SOM-Geo، بردارهایی نگاشت شدهاند که ازطرفی، ویژگیهای متفاوت دارند و از طرف دیگر، در چندین خوشۀ متفاوت دستهبندی شدهاند. این تفاوت الگوریتمها در نگاشت بردارهای ورودی به نورونهای شبکه بهدلیل وزن نسبی متفاوت هریک از متغیرها در بردارهای ورودی الگوریتمهاست.
شکل 4: ماتریس U و شمارۀ خوشههای الگوریتمهای SOM و Geo-SOM (منبع: نویسندگان 1402) Figure 4: U-Mat Cluster Number of SOM and Geo-SOM Algorithms
صفحات مؤلفهها الگوریتم نقشههای خودسازمانده، صفحۀ مؤلفۀ همۀ بردارهای ورودی را بهطور جداگانه، ترسیم میکند. این صفحات نشاندهندۀ وزنی است که بردار ورودی را به نورون شبکه نگاشت میکند. وزن هریک از بردارهای ورودی بین 0 تا 1 محاسبه شده است. با صفحات مؤلفه میتوان وزن نسبی هریک از مؤلفهها را در نگاشتشدن به نورونهای شبکه برآورد و با وزن نسبی مؤلفههای دیگر مقایسه و همبستگی موجود بین بردارهای ورودی و نحوۀ نگاشتشدن آنها را نیز تحلیل و بررسی کرد. صفحات عناصر بردارهای ورودی هر دو الگوریتم نشان میدهد که وزن نسبی هریک از متغیرها در نگاشتشدن به نورنهای شبکه بهطور کامل، متفاوت است؛ برای مثال، متغیر نسبت جمعیت متأهل، وزن نسبی متفاوتی را در نگاشتشدن به شبکه در الگوریتمهای SOM و Geo-SOM دارد. در الگوریتم SOM مقدارهای بیشتر این متغیر ورودی تمایل به نگاشتشدن در نورونهای بالا سمت چپ شبکه را دارد (نورورنهای قرمز رنگ)؛ زیرا منطبق بر خوشۀ شمارۀ 4 است و مقدارهای کمتر این متغیر تمایل به نگاشتشدن در نورونهای پایین سمت چپ شبکه را دارد؛ زیرا انطباق زیادی با خوشۀ شمارۀ 1 دارد (شکل 5). در الگوریتم Geo-SOM، مقدارهای بالاتر این متغیر در نورونهای سمت چپ شبکه و مقدارهای پایینتر آن در نورنهای پایین سمت چپ شبکه نگاشته شده است؛ زیرا مقدارهای بالاتر بر خوشههای شمارۀ 8 و 9 و مقدارهای پایینتر بر خوشههای شمارۀ 2 و 10 منطبق است (شکل 6). همچنین، در الگوریتم SOM مقدارهای زیاد متغیر نسبت باسوادی تمایل به نگاشتشدن در نورونهای سمت راست شبکه را دارد که انتظار میرود در خوشههای شمارۀ 4، 5 و 10 دستهبندی شود. درصورتی که مقدارهای پایین این متغیر تمایل به نگاشتشدن در نورونهای سمت چپ شبکۀ منطبق بر خوشههای شمارۀ 1 و 8 را دارد. در الگوریتم Geo-SOM مقدارهای بالای متغیر میزان باسوادی تمایل به نگاشتشدن در نورونهای بالا سمت راست شبکۀ منطبق بر خوشههای شمارۀ 7، 6 و یا 5 را دارد. درصورتی که مقدارهای پایین این متغیر تمایل به نگاشتشدن در نورونهای پایین سمت چپ شبکۀ منطبق بر خوشههای شمارۀ 10 و 2 را دارد که نتایج حاصل در جدولهای 1 و 2 بیانگر صحت عملکرد این الگوریتمها با این متغیرهاست. همچنین، مقایسۀ صفحات مؤلفۀ بردارهای ورودی نشان میدهد که نحوۀ نگاشتشدن و وزن نسبی مؤلفهها در هر الگویتم بهطور کامل، متفاوت است؛ درحالی که صفحۀ مؤلفۀ هریک از متغیرهای ورودی شبیه به یکدیگر نیست؛ بنابراین نحوۀ نگاشتشدن این متغیرها به نورونهای شبکه متفاوت است و این متغیرها با یکدیگر همبستگی ندارند.
شکل 5: صفحات مؤلفههای الگوریتم SOM (منبع: نویسندگان 1402) Figure 5: Component Planes of SOM Algorithm
شکل 6: صفحات مؤلفههای الگوریتم Geo-SOM (منبع: نویسندگان 1402) Figure 6: Component Planes of Geo-SOM Algorithm
Hits Maps الگوریتم نقشههای خودسازمانده، نقشۀ Hits Maps را پس از اتمام نگاشت بردارهای ورودی ترسیم میکند و تعداد نسبی برندهشدن نورونهای شبکه را نشان میدهد. هرچه اندازۀ ششضلعیها بزرگتر باشد، نشاندهندۀ این است که این نورون، دفعات بیشتری برنده شده و تعداد بیشتری بردار ورودی در آن نورون نگاشت شده است و برعکس. تحلیل و بررسی Hits map الگوریتمهای SOMو Geo-SOM نشان میدهد که توزیع بردارهای ورودی در نورونها برای این دو الگوریتم بهطور کامل، متفاوت است (شکل5). در الگوریتم SOM دو نورون شبکه بیشتر از بقیه نورونها برنده شده است؛ بنابراین تعداد بردارهای ورودی بیشتری در این دو نورون نگاشت شده است؛ بدین معنا که تنها چند نورون شبکه، بیشترین شانس برندهشدن را داشتند و بقیۀ نورنهای شبکه شانس کمتری داشتند. به همین خاطر، بردارهای ورودی کمتری نیز در آنها نگاشت شده است. این درحالی است که بردارهای ورودی الگوریتم Geo-SOM بهطور تقریبی، در نورونهای بیشتری نگاشت شده است؛ بهطوری که بیشتر نورنهای شبکه درمقایسه با الگوریتم SOM شانس بیشتری برای برندهشدن دارند و تعداد بیشتری بردار ورودی نیز در آنها نگاشت شده است. تأثیر متغیرهای ورودی در برندهشدن نورونها و نگاشتشدن بردارهای ورودی در این نورونها نشان میدهد که درنظرگرفتن بُعد مکانی، تأثیری مثبت در روند نگاشت بردارهای ورودی در نورونهای برنده داشته است.
شکل 7: Hits Map الگوریتمهای SOM و Geo-SOM (منبع: نویسندگان 1402) Figure 7: Hits Map of SOM and Geo-SOM Algorithms
نقشۀ بلوکهای آماری خوشهبندیشده شکلهای 8 و 9 نشاندهندۀ بلوکهای آماری خوشهبندیشدۀ کلانشهر اصفهان با استفاده از دو الگوریتم SOM و Geo-SOM است. همانطور که مشاهده میشود نتایج حاصل از خوشهبندی هر دو الگوریتم بهطور کامل، متفاوت است. الگوریتم SOM دادههای بلوک آماری را در خوشههایی درهمتنیده، ناهمگن و پراکنده خوشهبندی کرده است (شکل 8). متغیرهای مطالعهشده (دادههای بلوک آماری) وابسته به مکان هستند؛ بنابراین بلوکهایی که ازلحاظ مکانی نزدیک به یکدیگر هستند، تمایل به ویژگیهای مشابه دارند. پس اگر چنین دادههایی خوشهبندی شوند و ویژگیهای مکانی آنها لحاظ نشده باشد، ممکن است به خوشهبندی نامناسب منجر شوند که بهطور کامل، در نتایج خوشهبندی این الگوریتمها مشهود است. الگوریتم Geo-SOM با بهکارگیری ویژگیهای مکانی و استفاده از معیار شباهت دادههای بلوک آماری در روند آموزش الگوریتم، دادههای بلوک آماری را در خوشههایی متجانس و همگن دستهبندی کرده است (شکل 9). همانطور که انتظار میرفت، هر خوشه در یک محدودۀ جغرافیایی توزیع شده است. از آنجایی که روند خوشهبندی و متغیرهای بردارهای ورودی هر دو الگوریتم یکسان و تنها تفاوت این دو الگوریتم بهکارگیری مکانی در روند خوشهبندی الگوریتم Geo-SOM است، تحلیل ماتریسهای U، صفحات مؤلفهها و Hits Map هر دو الگوریتم نشان داد که تأثیر پارامترهای مکانی بر نتایج خوشهبندی دادههای بلوک آماری درخور توجه است.
شکل 8: نقشۀ بلوکهای آماری خوشهبندیشدۀ شهر اصفهان حاصل از الگوریتم SOM (منبع: نویسندگان 1402) Figure 8: Map of Clustered Census Blocks of Isfahan City Produced by SOM Algorithm
شکل 9: نقشۀ بلوکهای آماری خوشهبندیشدۀ شهر اصفهان حاصل از الگوریتم Geo-SOM (منبع: نویسندگان 1402) Figure 9: Map of Clustered Census Blocks of Isfahan City Produced by Geo-SOM Algorithm در الگوریتمهای SOM و Geo-SOM 13362 بلوک آماری در 10 خوشه طبق جدولهای 1 و 2 خوشهبندی شده است. در جدول1 که مربوط به نتایج حاصل از الگوریتم SOM است، خوشۀ 4 با 66/44 درصد از کل بلوکها بیشترین تعداد و خوشۀ 9 با 9/1 درصد کمترین تعداد بلوک را دارد که در ماتریس U الگوریتم SOM نیز مشاهده میشود که 23 نورون از 49 نورون در خوشۀ 4 و تنها 1 نورون در خوشۀ 9 دستهبندی شده است. در نتایج مربوط به الگوریتمGeo-SOM (جدول 2) خوشۀ 3 با 4508 بلوک آماری خوشهبندیشده و با 73/33 درصد کل بلوکها بیشترین تعداد و خوشۀ 1 با 36/1 درصد کمترین تعداد بلوک را دارد که در ماتریس U الگوریتم Geo-SOM نیز مشهود است که 17 نورون از 49 نورون در خوشۀ 3 و تنها 1 نورون در خوشۀ 1 دستهبندی شده است. باتوجه به نتایج الگوریتمGeo-SOM که در آن بلوکهای دستهبندیشده در یک محدودۀ جغرافیایی خاص محدود شدهاند، میتوان ویژگیهای هر خوشه را بهصورت «منطقهای» تحلیل کرد؛ برای مثال، در خوشۀ 5 واقع در مرکز و جنوب شهر اصفهان، میانگین مساحت واحد مسکونی برابر با 7/129 متر متربع است که نسبت به میانگین کل شهر که برابر با 6/115 متر مربع است، بالاتر است که این خود نشاندهندۀ بالاتربودن این شاخص ازمنظر توسعۀ پایدار شهری در این منطقه است. همچنین، خوشۀ 10 با میانگین 9/87 متر مربع واقع در شمال شرقی شهر، واحدهای مسکونی کوچکتری نسبت به میانگین کل شهر دارد. میانگین میزان باسوادی در کلانشهر اصفهان 91 درصد است؛ درحالی که خوشۀ 7 با میانگین 98 درصد واقع در جنوبیترین منطقۀ شهر، درصد باسوادی بیشتری را نسبت به میانگین کل شهر و خوشۀ 6 با میانگین 50 درصد واقع در جنوب شرقی شهر، میزان باسوادی کمتری نسبت به میانگین کل شهر دارد که ازمنظر توسعۀ پایدار شهری نشاندهندۀ بالاتربودن این شاخص در خوشۀ 7 و و پایینتربودن آن در خوشۀ 6 از میانگین کل شهر است. بهطور کلی باتوجه به پراکنش خوشهها در یک منطقۀ خاص و بررسی میانگین متغیرهای هر خوشه میتوان به نتایج مهمی دست یافت؛ برای مثال، خوشۀ 9 واقع در مناطق جنوبی شهر تراکم جمعیت کمتر، نسبت جمعیت متأهل بیشتر، میزان اشتغال بالاتر، نسبت جمعیت جوان متوسط، مساحت مسکونی بالاتر، تعداد مهاجران کمتر و نسبت باسوادی بالاتری از میانگین کل شهر دارد که نشان میدهد مناطق جنوبی ازلحاظ شاخصهای توسعۀ پایدار و کیفیت زندگی در وضعیت مناسبی قرار دارد. همچنین، خوشۀ 4 واقع در مناطق شمالی شهر بهدلیل داشتن تراکم جمعیت بیشتر، نسبت جمعیت متأهل متوسط، میزان اشتغال متوسط، نسبت جمعیت جوان بالاتر، مساحت مسکونی کمتر، تعداد مهاجران بیشتر و نسبت باسوادی کمتر نسبت به مناطق جنوبی ازلحاظ شاخصهای توسعۀ پایدار درسطح پایینتری قرار دارد. از آنجایی که توسعۀ پایدار شهری روندی در راستای بهبود شرایط فیزیکی، اقتصادی، اجتماعی، فرهنگی است، مدیریت این روند نیازمند شناسایی وضعیت موجود براساس معیارهای مرتبط است. شناسایی مناطق همگن درقالب خوشههای مجزا با خصوصیات معین، خود عاملی مؤثر و تسهیلکننده برای برنامهریزیهای محیطیِ متمرکز کوتاهمدت و بلندمدت است؛ درنتیجه بهکارگیری الگوریتمهای خوشهبندی مبتنی بر مکان (Geo)، خوشهبندی مناطق شهری را فراهم میکند که مبتنی بر شاخصهای توسعۀ پایدار و استخراج مناطق همگن برای تسهیل در مدیریت و برنامهریزی شهری است.
جدول 1: میانگین متغیرهای اجتماعی-اقتصادی در خوشههای حاصل از الگوریتم SOM Table 1: The Average of Socio-Economic Variables in the Clusters Produced by SOM Algorithm
منبع: نویسندگان 1402
جدول 2: میانگین متغیرهای اجتماعی-اقتصادی در خوشههای حاصل از الگوریتم Geo-SOM Table 2: The Average of Socio-Economic Variables in the Clusters Produced by Geo-SOM Algorithm
منبع: نویسندگان 1402
ارزیابی نتایج خوشهبندی SOM و Geo-SOM با مقایسۀ ضرایب سیلهوته بیانگر این است که در نتایج الگوریتم SOM بیشتر بلوکهای آماری خوشهبندیشده، ضرایب سیلهوته منفی و تعداد کمی ضریب سیلهوته مثبت دارند. این درحالی است که ضرایب سیلهوته بلوکهای آماری خوشهبندیشدۀ الگوریتم Geo-SOM مثبت بوده است و تعداد کمی ضرایب سیلهوته منفی داشتند. کیفیت کلی نتایج خوشهبندی با استفاده از میانگین ضریب سیلهوته برای کل مجموعه داده بدین صورت است که الگوریتم Geo-SOM با میانگین ضریب سیلهوته 27/0 نسبت به الگوریتم SOM با میانگین ضریب سیلهوته 02/0- کیفیت خوشهبندی بالاتری دارد. این نتایج بیانگر تأثیر مثبت پارامترهای مکانی در روند خوشهبندی است.
نتیجهگیری شبکههای عصبی خودسازمانده کاربردیترین شبکۀ استفادهشده در مسائل خوشهبندی است؛ زیرا پس از آموزش شبکه، میتوان از ابزارهای بصریسازی آن برای تجزیهوتحلیل خوشههای حاصل استفاده کرد. از نقشههای خودسازمانده برای خوشهبندی دادهها و کاهش ابعاد دادهها استفاده میشود. در پژوهش حاضر برای خوشهبندی دادههای بلوک آماری از دو الگوریتم شبکههای عصبی خودسازماندۀ SOM و Geo-SOM استفاده شد. هدف اصلی پژوهش حاضر اعمال پارامترهای مکانی در روند خوشهبندی شبکههای عصبی خودسازمانده بود که مختصات جغرافیایی دادههای بلوکهای آماری بهعنوان پارامتر مکانی در کنار سایر متغیرهای ورودی به شبکه اعمال شد. ضریب سیلهوته و میانگین کلی سیلهوته در ارزیابی نتایج، نشاندهندۀ تأثیر مثبت پارامترهای مکانی در روند خوشهبندی الگوریتم Geo-SOM است؛ بنابراین الگوریتم Geo-SOM نسبت به الگوریتم SOM یک خوشهبندی مناسب و منسجم از بلوکهای آماری را باتوجه به شباهت و ویژگیهای مکانی آنها ایجاد میکند. در پژوهش حاضر پتانسیل این الگوریتم در تعریف مناطق همگن و شناسایی بلوکهای مشابه در یک مجموعه داده واقعی نشان داده شد. الگوریتم Geo-SOM مناطق همگن را براساس متغیرهای منتخب شناسایی کرد که این خود منجر به تسهیل برنامهریزیهای شهری منطبق با رویکرد توسعۀ پایدار میشود. | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
مراجع | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
منابع
احمدی، علی، حسینیفر، سید محسن، و نصیری هندخاله، اسماعیل. (1395). تأثیر مهاجرت بر توسعۀ شهری با استفاده از مدل ( SWOTمورد مطالعه: شهر بابل). دو فصلنامۀ پژوهشهای بومشناسی شهری، 7(2)، 55-66.
برقی، اسماعیل (1397). سوادآموزی عنصر کلیدی توسعۀ پایدار. نشریۀ راهبرد توسعه، 14 (4)،187-210.
تقوایی، مسعود، و صفرآبادی، اعظم. (1392). توسعۀ پایدار شهری و برخی عوامل مؤثر بر آن (مورد مطالعه: شهر کرمانشاه). فصلنامۀ مطالعات جامعهشناختی شهری، 3(6)، 1-26.
توده فلاح، معصومه، خطیبی، آمنه، صفاکیش، محدثه، و عباسی، محمدباقر. (1397). نگاهی به ساخت سنی و وضع مشارکت در بازار کار مردان و زنان درمعرض ازدواج و طلاق از دریچۀ سرشماری. فصلنامۀ جمعیت، 20(5)، 57-76.
سپهوند، رضا، و عارفنژاد، محسن. (1392). اولویتبندی شاخصهای توسعۀ پایدار شهری با رویکرد تجزیهوتحلیل سلسلهمراتبی گروهی (مطالعۀ موردی: در شهر اصفهان). مطالعات ساختار و کارکرد شهری، 1(1)، 43-59.
محمدزاده، رحمت. (1394). بررسی تطبیقی الگوی مجتمعهای مسکونی ویلائی و آپارتمانی (مطالعۀ موردی: شهر جدید سهند). جغرافیا و برنامهریزی، 19(54)، 297-302.
موسوی، میرسعید (1397). بررسی سطح تحقق توسعۀ پایدار شهر تبریز براساس شاخص ردپای بومشناختی. جغرافیا و مطالعات محیطی، 7(27)، 61-76.
نصیری دارانی، شهربانو. (1401). تحلیل حساسیت روش ارزیابی چندمعیارۀ مکانی به تغییر توابع استانداردسازی و وزن معیارها (مطالعۀ موردی: سنجش وضعیت پایداری توسعه در شهر اصفهان). پایان نامه دکتری، دانشگاه شهید بهشتی تهران.
References
Ahmadi, A.‚ Hosseini Far, S. M.‚ & Nasiri Handkhale, I. (2015). The impact of immigration on urban development using the model (SWOT case study: Babol city). Journal of Urban Ecology Research, 7(2)‚ 55-66.] In Persian[.
Aldegheishem, A. (2014). Evaluating the urban sustainable development on the basis of AHP: A case study for Riyadh city. Journal of Sustainable Development, 7(2), 113. Doi: 10.5539/jsd.v7n2p113
Andrienko, G., Andrienko, N., Bak, P., Bremm, S., Keim, D., von Landesberger, T., & Schreck, T. (2010). A framework for using self-organising maps to analyze spatio-temporal patterns, exemplified by analysis of mobile phone usage. Journal of Location Based Services, 4(3-4), 200-221. Doi: 10.1080/17489725.2010.532816
Bação, F., Lobo, V., & Painho, M. (2004). Geo-self-organizing map (Geo-SOM) for building and exploring homogeneous regions. In International Conference on Geographic Information Science (pp. 22-37). Springer, Berlin, Heidelberg. https://doi.org/10.1007/978-3-540-30231-5_2
Barghi, I. (2017). Literacy is the key element of sustainable development. Strategic Development Journal, 14(4)‚ 187-210. ]In Persian[.
Fayyad, U., Piatetsky-Shapiro, G., & Smyth, P. (1996). From data mining to knowledge discovery in databases. AI Magazine, 17(3), 37-37. https://doi.org/10.1609/aimag.v17i3.1230
Galutira, E. F., Fajardo, A. C., & Medina, R. P. (2019). A novel Kohonen self-organizing maps using exponential decay average rate of change for color clustering. In Intelligent and Interactive Computing (pp. 23-33). Springer, Singapore. https://doi.org/10.1007/978-981-13-6031-2_28
Grubesic, T. H., Wei, R., & Murray, A. T. (2014). Spatial clustering overview and comparison: Accuracy, sensitivity, and computational expense. Annals of the Association of American Geographers, 104(6), 1134-1156. https://doi.org/10.1080/00045608.2014.958389
Hagenauer, J., & Helbich, M. (2016). SPAWNN: A Toolkit for spatial analysis with self‐organizing neural networks. Transactions in GIS, 20(5), 755-774. https://doi.org/10.1111/tgis.12180
Hsu, K. C., & Li, S. T. (2010). Clustering spatial–temporal precipitation data using wavelet transform and self-organizing map neural network. Advances in Water Resources, 33(2), 190-200. https://doi.org/10.1016/j.advwatres.2009.11.005
Jain, A. K., Murty, M. N., & Flynn, P. J. (1999). Data clustering: A review. ACM Computing Surveys (CSUR), 31(3), 264-323. https://doi.org/10.1145/331499.331504
Kassambara, A. (2017). Practical guide to cluster analysis in R: Unsupervised machine learning (Vol. 1). Sthda.
Kaufman, L., & Rousseeuw, P. J. (2009). Finding groups in data: an introduction to cluster analysis. John Wiley & Sons.
Klösgen, W., & Żytkow, J. M. (1996). Knowledge discovery in databases terminology. In Advances in knowledge discovery and data mining (pp. 573-592).
Kohonen, T. (1995). Self-Organizing Maps, Springer Series in Information Science (Vol. 30). Springer.
Lez’er, V., Semerianova, N., Kopytova, A., & Truntsevsky, Y. (2019). Youth entrepreneurship as a basis for sustainable urban development: Social and legal aspect. In E3S Web of Conferences (Vol. 110, p. 02093). EDP. https://doi.org/10.1051/e3sconf/201911002093
Li, T., Sun, G., Yang, C., Liang, K., Ma, S., & Huang, L. (2018). Using self-organizing map for coastal water quality classification: Towards a better understanding of patterns and processes. Science of the Total Environment, 628, 1446-1459. https://doi.org/10.1016/j.scitotenv.2018.02.163
Liao, X., Tao, H., Gong, X., & Li, Y. (2019). Exploring the database of a soil environmental survey using a geo-self-organizing map: A pilot study. Journal of Geographical Sciences, 29, 1610-1624. https://doi.org/10.1007/s11442-019-1644-8
Löhr, S. C., Grigorescu, M., Hodgkinson, J. H., Cox, M. E., & Fraser, S. J. (2010). Iron occurrence in soils and sediments of a coastal catchment: A multivariate approach using self organising maps. Geoderma, 156(3-4), 253-266. https://doi.org/10.1016/j.geoderma.2010.02.025
Miller, H. J. (2010). The data avalanche is here. Shouldn’t we be digging?. Journal of Regional Science, 50(1), 181-201. https://doi.org/10.1111/j.1467-9787.2009.00641.x
Mohammadzadeh, R. (2014). A comparative study of the pattern of villa and apartment residential complexes (A case study of the new city of Sahand). Scientific Journal of Geography and Planning, 19(54)‚ 279-302. ]In Persian[.
Mousavi, M. (2017). Examining the level of realization of sustainable development of Tabriz city based on ecological footprint index. Geography and Environmental Studies Quarterly, 7(27)‚ 61-76. ]In Persian[.
Nasiri Darani ‚Sh. (2022). Sensitivity analysis of spatial multi-criteria evaluation method to change the standardization functions and weight of criteria (Case study: assessing the sustainability of development in Isfahan). PhD Thesis. Shahid Beheshti University. [In Persian[.
Openshaw, S. (1999). Geographical data mining: Key design issues. In Proceedings of GeoComputation (Vol. 99).
Park, Y. S., Chon, T. S., Bae, M. J., Kim, D. H., & Lek, S. (2018). Multivariate data analysis by means of self-organizing maps. In Ecological Informatics (pp. 251-272). Springer, Cham. https://doi.org/10.1007/978-3-319-59928-1_12
Patel, P., & Patel, A. (2021). Use of sustainable green materials in construction of green buildings for sustainable development. IOP Conference Series: Earth and Environmental Science (Vol. 785, No. 1, p. 012009). IOP Publishing. Doi: 10.1088/1755-1315/785/1/012009
Rodrigues, M., & Franco, M. (2020). Measuring the urban sustainable development in cities through a composite index: The case of Portugal. Sustainable Development, 28(4), 507-520. https://doi.org/10.1002/sd.2005
Sepahvand, R.‚ & Arifnejad, M. (2012). Prioritization of sustainable urban development indicators with a group hierarchical analysis approach (Case study: in Isfahan city). Studies of Urban Structure and Function, 1(1), 43-59. ]In Persian[.
Sheela, K. G., & Deepa, S. N. (2012). An efficient hybrid neural network model in renewable energy systems. IEEE International Conference on Advanced Communication Control and Computing Technologies (ICACCCT) (pp. 359-361). IEEE. Doi: 10.1109/ICACCCT.2012.6320802
Stefanovic, P., & Kurasova, O. (2011). Visual analysis of self-organizing maps. Nonlinear Analysis: Modeling and Control, 16(4), 488-504. DOI: 10.15388/NA.16.4.14091.
Stefanovic, P., & Kurasova, O. (2018). Outlier detection in self-organizing maps and their quality estimation. Neural Network World, 28(2), 106-117. DOI:10.14311/NNW.2018.28.006
Sui, D. Z. (2004). Tobler's first law of geography: A big idea for a small world?. Annals of the Association of American Geographers, 94(2), 269-277. https://doi.org/10.1111/j.1467-8306.2004.09402003.x
Taghavai, M.‚ & Safarabadi, A. (2012). Sustainable urban development and some factors affecting it (Study: Kermanshah city). Quarterly Journal of Urban Sociological Studies‚ 3(26), 1-26. [In Persian[.
Tobler, W. R. (1970). A computer movie simulating urban growth in the Detroit region. Economic Geography, 46(sup1), 234-240. https://doi.org/10.2307/143141
Tude Fallah, M.‚ Khatibi, A.‚ Safakish, M.‚ & Abbasi, M. B. (2017). Looking at the structure of age and participation in the labor market of men and women subject to marriage and divorce through the lens of the census. Population Quarterly, 20(5), 57-76. ]In Persian[.
Vesanto, J., & Alhoniemi, E. (2000). Clustering of the self-organizing map. IEEE Transactions on Neural Networks, 11(3), 586-600. DOI: 10.1109/72.846731
Wankhede, S. B. (2014). Analytical study of neural network techniques: SOM, MLP, and classifier-a survey. IOSR J. Comput. Eng. Ver. VII, 16(3), 2278-661.
Yuan, M., Buttenfield, B., Gahegan, M., & Miller, H. (2004). Geospatial data mining and knowledge discovery. In A research agenda for geographic information science (pp. 365-388). CRC Press.
Zhang, J., & Fang, H. (2012). Using self-organizing maps to visualize, filter, and cluster multidimensional bio-omics data. Applications of Self-Organizing Maps, 181-204. | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
آمار تعداد مشاهده مقاله: 230 تعداد دریافت فایل اصل مقاله: 179 |