تحصيلات تکميلي

نام و نام خانوادگي : حامد موحديان عطار

دانشکده : فني و مهندسي

استاد راهنما : دکتر احمد براآني

تاريخ دفاع : 1/8/84

رشته و گرايش : کامپيوتر-نرم افزار

استاد مشاور : -

پنهان سازي قوانين وابستگي به وسيله مسدود سازي داده ها

چکيده

با انفجار اطلاعات در سالهاي اخير نياز به داده کاوي در قالب ابزارهايي براي مديريت بهتر انبوه اطلاعات و کاوش روابط و اطلاعات جديد بيش از پيش مورد توجه قرار گرفته. در موارد ي که تعداد آنها کم نيست نياز مي شود که براي مثال يک سازمان دولتي يا شرکت خصوصي اطلاعات انباشته شد خود که براي جمع آوري آنها طبعاً هزينه شده است را جهت برخي تحقيقات به بيرون سازمان يا شرکت انتشار دهد. مشکلي که در اين رابطه وجود دارد از اين قرار است که سازمان يا شرکت مورد بحث ممکن است اطلاعات محرمانه اي در بين انبوه اطلاعات خود داشته باشد و مايل به انتشار آنها نباشد. در اين پايان نامه به دنبال راهي هستيم که براي مثال در چنين شرايطي سازمان مذکور اطلاعات محرمانه و يا دانش محرمانه اي که در انبوه اطلاعات وجود دارد را به نحوي در پايگاه داده پنهان کند و از اين راه بتواند بدون نگراني از فاش شدن اطلاعات و يا دانش محرمانه خود پايگاه داده جديد ( پايگاه داده اي که اطلاعات و يا دانش محرمانه در آن پنهان شده است ) را به خارج از سازمان انتشار بدهد.

به صورت خاص در روشي که در اين پايان نامه ارائه شده دانش محرمانه را پنهان مي کنيم. دانشي که به آن پرداخته شده قوانين وابستگي هستند که در اثر اعمال الگوريتم هاي داده کاوي به دست مي آيند. روند انجام کار به اين صورت است که برخي از قوانين که براي شرکت يا سازمان مربوطه اهميت خاصي دارد به عنوان قوانين محرمانه معرفي مي شوند. روشهاي ارائه شده در اين پايان نامه با داشتن فهرست قوانين محرمانه مذکور آنها را در بطن پايگاه داده پنهان مي کنند. روشي که براي پنهان سازي ارائه شده بر اساس مسدود کردن برخي از داده ها در پايگاه داده مي باشد. روشهاي قبلي پنهان سازي قوانين وابستگي بر اساس ايجاد اغتشاش در داده ها ، جابجايي داده ها در پايگاه داده و ... عمل مي کردند.

در اين راستا دو الگوريتم کلي ارائه مي شود. در يکي فقط داده هاي که قبلاً صفر بوده اند مسدود مي شوند و در ديگري داده هايي که قبلاً يک بوده اند مسدود مي شوند. در حالت کلي کليه روشها ي پنهان سازي قوانين وابستگي عوارض منفي به همراه دارند که مهمترين آنها پنهان شدن قوانيني است که نمي خواهيم پنهان شوند و از آنها به عنوان قوانين گم شده ياد مي کنيم. جهت کاهش قوانين گم شده در مجموع 9 استراتژي متفاوت ارئه مي شود و با به کار بردن آنها در دو الگوريتم اوليه، 24 الگوريتم متفاوت بدست مي آيد. تمامي الگوريتم هاي مذکور روي ده پايگاه داده متفاوت در کليه شرايط آزمايش مي شوند و در نهايت دو الگوريتم به عنوان الگوريتم هاي منتخب شناخته شده مي شود. دو الگوريتم منتخب را با الگوريتم هاي قبلي که بر پايه اغتشاش کار مي کردند مقايسه مي کنيم و نتايج رضايت بخشي حاصل مي شود.