مسئلۀ تشخیص خانوارهای کم درآمد: بررسی آماری

هر وقت صحبت از هدفمندکردن یارانه‌های دولت (هدفمندی به معنای پرداخت یارانه به کم‌درآمدها، نه به همگان، آنچنان که شد) به میان می‌آید، دولتیان از یک «مشکل غیرقابل‌حل» حرف می‌زنند که مسئلۀ شناسایی است. می گویند نمی‌توان افراد کم‌درآمد را تشخیص داد.

این مسئله هیچ توجیهی ندارد. دولت اگر بخواهد مسئولانه عمل کند، بخصوص وقتی که با تحریمها و مشکلات بودجه‌ای روبرو است، باید کاری که همۀ اقتصادهای مدرن می‌کنند بکند، یعنی به کار گرفتن عالمانۀ روشهای تشخیص خانوارهای کم‌درآمد و تنظیم بانک اطلاعات.

قبل از هر چیز باز باید بگویم، آنچنان که بسیاری از اقتصاددانان به کرات گفته اند، که بانکهای اطلاعاتی که در ایران هست، از قبیل کمیتۀ امداد، بنیادهای مختلف، بهزیستی، سازمان‌های بازنشستگی، خیریه‌ها و خودِ دولت، آنقدر اطلاعات دارند که اگر فقط همین‌ها جمع و استفاده شوند، بخش قابل توجهی از افراد کم درآمد تحث پوشش قرار می‌گیرند.

ولی مستقل از این، به نظر می‌رسد مشکل جای دیگری است: مسئلۀ کمک‌های دولتی در ذهن دولتیان این است که شما دقیقاً بدانید هر کس چقدر درآمد دارد و چقدر از مرزی که برای کمک‌های دولتی تعیین می‌شود کمتر یا بیشتر است تا در صورت لزوم به او کمک شود. برای همین است که افرادی از جمله سخنگوی دولت بارها گفته بودند تا نتوانیم سطح درآمد را تعیین کنیم یارانۀ کسی را قطع نمی‌کنیم.

روش درست شناسایی، روش احتمالی است نه قطعی. راهش این است که تعدادی مشخصات قابل مشاهده را در نظر بگیریم و با استفاده از آمار موجود، مثل آمار بودجۀ خانوار، ربط آن را با وضع درآمدی «به طور احتمالی» به دست بیاوریم. به این ترتیب برای هر خانوار با مشخصات قابل مشاهده تعدادی عدد داریم که احتمال قرار گرفتن در گروه‌های درآمدی را بدست می‌دهند.

این احتمالات قطعاً باید هوشمندانه استفاده شوند. مثلاً وقتی احتمال قرار گرفتن در دهک پایین درآمدی برای خانواری خیلی بالا باشد، می توان کمک‌های دولتی را با سخاوت بیشتر و پرس و جوی کمتر پرداخت کرد. ولی اگر کسی با احتمال زیاد در درآمدهای بالاتر قرار می‌گیرد، می‌توان به سهولت تقاضاها را رد کرد یا کمک‌ها را موکول کرد به پرس و جوی بیشتر.

من با استفاده از آمار بودجۀ خانوار 1394 سعی کردم یک محاسبۀ خیلی بدوی بکنم. با توجه به اینکه درآمد توزیع جغرافیایی دارد، هم در میان شهرها و روستاها، هم در استانها، و در درون شهر و روستا، متغیرهای اصلی که من استفاده کردم متغیر شهر و روستا، استان، و ارزش اجاری مسکن خانوار است که درصد بسیار بالایی از وضع درآمدی را توضیح می‌دهند. از آنجا که وضع بازار مسکن در شهر و روستا خیلی متفاوت است، تحلیل را برای شهر و روستا بطور جداگانه انجام دادم. متغیرهای دیگر عبارتند از سن سرپرست خانوار و همسر، تحصیلات سرپرست و همسر، مالکیت خانه، وضعیت اشتغال سرپرست و همسر، و تعداد افراد خانوار. توجه کنید که هیچ قلم هزینه‌ای یا درآمدی را استفاده نمی‌کنم.

برای وضع درآمدی خانوارها هم از سرانۀ هزینه‌های خانوار استفاده کردم. در یک رگرسیون ساده، متغیرهای فوق حدود 60 درصد هزینه سرانۀ خانوارها در مناطق شهری و حدود 40 درصد آن در مناطق روستایی را توضیح می‌دهند. تفاوت شهر و روستا هم بر‌می‌گردد به محدود بودن نقش اطلاعاتی ارزش اجاری مسکن در روستاها. می‌توان در روستاها متغیرهای دیگری را به کار برد.

همچنین بر مبنای طبقه‌بندی خانوارها به پنج گروه درآمدی، و با استفاده از مدل پروبیت مرتب شده، احتمالِ قرار گرفتن در هر گروه درآمدی را بدست آوردم.  نتایج را برای مناطق شهری در زیر می‌بینید. اگر با اقتصادسنجی آشنا نیستید، به ستون z نگاه کنید. اگر این ستون بیشتر از دو باشد به معنای اهمیت آماری متغیر است. همانطور که دیده می‌شود، لگاریتم ارزش اجاری منزل مسکونی اهمیت بسیار زیادی دارد. همچنین است برای بیشتر متغیرهای استفاده شده.

برای اینکه ببینم احتمالات چگونه توزیع شده اند، متوسطِ احتمالاتِ برآورد شده برای هر گروه درآمدی را حساب کرده‌ام. جدول زیر این متوسط‌ها را برای شهر و روستا نشان می‌دهد. مثلاً ردیف اول نشان می‌دهد که برای افرادی که درآمدشان در آمار در گروه اول قرار می گیرد، متوسط احتمال برآورد شده برای بودن در گروه اول %50 است. متوسط احتمال بودن در گروه درآمدی بالاتر هم به ترتیب، %25 و %14 و %8  و %3 است.

برآوردها برای شهر بهتر از روستا است، چرا که همانطور که گفتم ارزش اجاری مسکن در شهر مهم‌تر از روستا است.

همچنین مدل برای شناسایی گروه کم‌درآمد و پردرآمد خیلی بهتر از درآمدهای میانه معتبر است که نشان می دهد می‌توان تا حد خوبی افراد نیازمند را تشخیص داد.

توجه کنید که این اعداد فقط متوسط احتمالات هستند. اگر مشخصات افراد به مدل داده شود، می توان با احتمال مربوطه برای هر خانوار کار کرد.

در نهایت، این جداول حاصل کار من در یک روز است و البته محدودیت‌های متعددی دارد از جمله شکل تابعی که من استفاده کرده‌ام. حوزۀ تخصصی من هم این کار نیست. سازمان‌ها و افرادی که در ایران کار می کنند، با همین آمار موجود در ایران، می‌توانند بسیار دقیق‌تر عمل کنند. پژوهش‌گرانی هم که در این حوزه کار می‌کنند، بهتر است سری هم به حوزۀ هوش مصنوعی بزنند که روش‌های بدیعی برای غلبه بر محدودیت‌های مدل‌های ساده‌ای مثل مدل من دارد.

2 Responses to مسئلۀ تشخیص خانوارهای کم درآمد: بررسی آماری

  1. ضیا says:

    سلام آقای دکتر
    1. این آرما ها را در ایران کدام نهاد بدست میاورد و در کجا موجود است؟ «متغیرهای دیگر عبارتند از سن سرپرست خانوار و همسر، تحصیلات سرپرست و همسر، مالکیت خانه، وضعیت اشتغال سرپرست و همسر، و تعداد افراد خانوار. »
    2. لطف کرده شکل تابعی که استفاده شده است را نیز کمی توضیح دهید؟
    3. در لیست متغیرها؛ آیا اعداد 1 تا 30 متغیر ها است؟ ضمناً که چندین متغیر دیگر زیر آنها آمده اند؟
    4. متوسطِ احتمالاتِ برآورد شده برای هر گروه درآمدی را بصورت دستی از نتایج تخمین بدست آورده اید؟

    • حسین says:

      سلام ضیا
      آمار بودجۀ خانوار است. مرکز آمار این آمارها را تهیه می کند. تمامی کشورهای دنیا آماری مشابه دارند. در افغانستان «سروی وضعیت زنده گی مردم» شبیه آمار بودجۀ خانوار است و اطلاعات مشابه دارد.
      مدل من ordered probit است که ترکیب متغیرهای توضیحی اش خطی است. اگر قرار باشد کاری وسیع و جدی انجام شود باید روابط غیر خطی در نظر گرفته شود.
      اعداد یک تا سی متغیرهای مرتبط با استانها هستند. برای هر استان یک dummy variable استفاده می شود.
      برای احتمالات، ابتدا احتمال برای هر خانوار را برآورد کردم و بعد متوسط گرفتم. Stata برای اینها دستور دارد.

نظر شما در مورد این نوشته چیست؟

در پایین مشخصات خود را پر کنید یا برای ورود روی یکی از نمادها کلیک کنید:

نماد WordPress.com

شما در حال بیان دیدگاه با حساب کاربری WordPress.com خود هستید. خروج /  تغییر حساب )

عکس فیسبوک

شما در حال بیان دیدگاه با حساب کاربری Facebook خود هستید. خروج /  تغییر حساب )

درحال اتصال به %s

%d وب‌نوشت‌نویس این را دوست دارند: