مسئلۀ تشخیص خانوارهای کم درآمد: بررسی آماری
ژوئیه 27, 2018 2 دیدگاه
هر وقت صحبت از هدفمندکردن یارانههای دولت (هدفمندی به معنای پرداخت یارانه به کمدرآمدها، نه به همگان، آنچنان که شد) به میان میآید، دولتیان از یک «مشکل غیرقابلحل» حرف میزنند که مسئلۀ شناسایی است. می گویند نمیتوان افراد کمدرآمد را تشخیص داد.
این مسئله هیچ توجیهی ندارد. دولت اگر بخواهد مسئولانه عمل کند، بخصوص وقتی که با تحریمها و مشکلات بودجهای روبرو است، باید کاری که همۀ اقتصادهای مدرن میکنند بکند، یعنی به کار گرفتن عالمانۀ روشهای تشخیص خانوارهای کمدرآمد و تنظیم بانک اطلاعات.
قبل از هر چیز باز باید بگویم، آنچنان که بسیاری از اقتصاددانان به کرات گفته اند، که بانکهای اطلاعاتی که در ایران هست، از قبیل کمیتۀ امداد، بنیادهای مختلف، بهزیستی، سازمانهای بازنشستگی، خیریهها و خودِ دولت، آنقدر اطلاعات دارند که اگر فقط همینها جمع و استفاده شوند، بخش قابل توجهی از افراد کم درآمد تحث پوشش قرار میگیرند.
ولی مستقل از این، به نظر میرسد مشکل جای دیگری است: مسئلۀ کمکهای دولتی در ذهن دولتیان این است که شما دقیقاً بدانید هر کس چقدر درآمد دارد و چقدر از مرزی که برای کمکهای دولتی تعیین میشود کمتر یا بیشتر است تا در صورت لزوم به او کمک شود. برای همین است که افرادی از جمله سخنگوی دولت بارها گفته بودند تا نتوانیم سطح درآمد را تعیین کنیم یارانۀ کسی را قطع نمیکنیم.
روش درست شناسایی، روش احتمالی است نه قطعی. راهش این است که تعدادی مشخصات قابل مشاهده را در نظر بگیریم و با استفاده از آمار موجود، مثل آمار بودجۀ خانوار، ربط آن را با وضع درآمدی «به طور احتمالی» به دست بیاوریم. به این ترتیب برای هر خانوار با مشخصات قابل مشاهده تعدادی عدد داریم که احتمال قرار گرفتن در گروههای درآمدی را بدست میدهند.
این احتمالات قطعاً باید هوشمندانه استفاده شوند. مثلاً وقتی احتمال قرار گرفتن در دهک پایین درآمدی برای خانواری خیلی بالا باشد، می توان کمکهای دولتی را با سخاوت بیشتر و پرس و جوی کمتر پرداخت کرد. ولی اگر کسی با احتمال زیاد در درآمدهای بالاتر قرار میگیرد، میتوان به سهولت تقاضاها را رد کرد یا کمکها را موکول کرد به پرس و جوی بیشتر.
من با استفاده از آمار بودجۀ خانوار 1394 سعی کردم یک محاسبۀ خیلی بدوی بکنم. با توجه به اینکه درآمد توزیع جغرافیایی دارد، هم در میان شهرها و روستاها، هم در استانها، و در درون شهر و روستا، متغیرهای اصلی که من استفاده کردم متغیر شهر و روستا، استان، و ارزش اجاری مسکن خانوار است که درصد بسیار بالایی از وضع درآمدی را توضیح میدهند. از آنجا که وضع بازار مسکن در شهر و روستا خیلی متفاوت است، تحلیل را برای شهر و روستا بطور جداگانه انجام دادم. متغیرهای دیگر عبارتند از سن سرپرست خانوار و همسر، تحصیلات سرپرست و همسر، مالکیت خانه، وضعیت اشتغال سرپرست و همسر، و تعداد افراد خانوار. توجه کنید که هیچ قلم هزینهای یا درآمدی را استفاده نمیکنم.
برای وضع درآمدی خانوارها هم از سرانۀ هزینههای خانوار استفاده کردم. در یک رگرسیون ساده، متغیرهای فوق حدود 60 درصد هزینه سرانۀ خانوارها در مناطق شهری و حدود 40 درصد آن در مناطق روستایی را توضیح میدهند. تفاوت شهر و روستا هم برمیگردد به محدود بودن نقش اطلاعاتی ارزش اجاری مسکن در روستاها. میتوان در روستاها متغیرهای دیگری را به کار برد.
همچنین بر مبنای طبقهبندی خانوارها به پنج گروه درآمدی، و با استفاده از مدل پروبیت مرتب شده، احتمالِ قرار گرفتن در هر گروه درآمدی را بدست آوردم. نتایج را برای مناطق شهری در زیر میبینید. اگر با اقتصادسنجی آشنا نیستید، به ستون z نگاه کنید. اگر این ستون بیشتر از دو باشد به معنای اهمیت آماری متغیر است. همانطور که دیده میشود، لگاریتم ارزش اجاری منزل مسکونی اهمیت بسیار زیادی دارد. همچنین است برای بیشتر متغیرهای استفاده شده.
برای اینکه ببینم احتمالات چگونه توزیع شده اند، متوسطِ احتمالاتِ برآورد شده برای هر گروه درآمدی را حساب کردهام. جدول زیر این متوسطها را برای شهر و روستا نشان میدهد. مثلاً ردیف اول نشان میدهد که برای افرادی که درآمدشان در آمار در گروه اول قرار می گیرد، متوسط احتمال برآورد شده برای بودن در گروه اول %50 است. متوسط احتمال بودن در گروه درآمدی بالاتر هم به ترتیب، %25 و %14 و %8 و %3 است.
برآوردها برای شهر بهتر از روستا است، چرا که همانطور که گفتم ارزش اجاری مسکن در شهر مهمتر از روستا است.
همچنین مدل برای شناسایی گروه کمدرآمد و پردرآمد خیلی بهتر از درآمدهای میانه معتبر است که نشان می دهد میتوان تا حد خوبی افراد نیازمند را تشخیص داد.
توجه کنید که این اعداد فقط متوسط احتمالات هستند. اگر مشخصات افراد به مدل داده شود، می توان با احتمال مربوطه برای هر خانوار کار کرد.
در نهایت، این جداول حاصل کار من در یک روز است و البته محدودیتهای متعددی دارد از جمله شکل تابعی که من استفاده کردهام. حوزۀ تخصصی من هم این کار نیست. سازمانها و افرادی که در ایران کار می کنند، با همین آمار موجود در ایران، میتوانند بسیار دقیقتر عمل کنند. پژوهشگرانی هم که در این حوزه کار میکنند، بهتر است سری هم به حوزۀ هوش مصنوعی بزنند که روشهای بدیعی برای غلبه بر محدودیتهای مدلهای سادهای مثل مدل من دارد.
سلام آقای دکتر
1. این آرما ها را در ایران کدام نهاد بدست میاورد و در کجا موجود است؟ «متغیرهای دیگر عبارتند از سن سرپرست خانوار و همسر، تحصیلات سرپرست و همسر، مالکیت خانه، وضعیت اشتغال سرپرست و همسر، و تعداد افراد خانوار. »
2. لطف کرده شکل تابعی که استفاده شده است را نیز کمی توضیح دهید؟
3. در لیست متغیرها؛ آیا اعداد 1 تا 30 متغیر ها است؟ ضمناً که چندین متغیر دیگر زیر آنها آمده اند؟
4. متوسطِ احتمالاتِ برآورد شده برای هر گروه درآمدی را بصورت دستی از نتایج تخمین بدست آورده اید؟
سلام ضیا
آمار بودجۀ خانوار است. مرکز آمار این آمارها را تهیه می کند. تمامی کشورهای دنیا آماری مشابه دارند. در افغانستان «سروی وضعیت زنده گی مردم» شبیه آمار بودجۀ خانوار است و اطلاعات مشابه دارد.
مدل من ordered probit است که ترکیب متغیرهای توضیحی اش خطی است. اگر قرار باشد کاری وسیع و جدی انجام شود باید روابط غیر خطی در نظر گرفته شود.
اعداد یک تا سی متغیرهای مرتبط با استانها هستند. برای هر استان یک dummy variable استفاده می شود.
برای احتمالات، ابتدا احتمال برای هر خانوار را برآورد کردم و بعد متوسط گرفتم. Stata برای اینها دستور دارد.