هوش مصنوعی، یادگیری ماشینی و بلاک چین: ابزارهایی برای افزایش اعتماد در دادهها
نوشته شده توسط:امیر سلامی در | ۰۲ اردیبهشت ۱۳۹۸ - ۱۶:۵۵ | ۰ دیدگاهایجاد اعتماد در دادهها (اطمینان یافتن از صحت و امنیت آنها) یکی از پیشنیازهای مهم برای ادامهی فعالیت شرکتها و سازمانهایی است که باید بهدقت از اطلاعات موجود خود نگهداری کنند. هر قدر اهمیت دادهها برای سازمانها بیشتر میشود و حکم نوعی دارایی را مییابد، کسب اطمینان از قابل اعتماد و اثباتپذیر بودن منابع داده نیز اهمیت بیشتری پیدا میکند.
مؤسسه فناوری ماساچوست (MIT) برنامهای برای مدیریت اعتماد در دادهها در دست اجرا دارد و مقالهای نیز با عنوان «به سوی اینترنت دادههای قابل اعتماد: چهارچوبی جدید برای به اشتراکگذاری داده و هویت» منتشر شده است.
مؤسسه فناوری ماساچوست (MIT)
نویسندگان این مقاله بر ضرورت و نیاز به منابع قابلاطمینان و قابل بررسی داده و سامانههایی که بتوانند به صورت خودکار به بررسی هر نوع تغییر صورت گرفته در دادهها بپردازند تأکید داشتند. چنین سامانههایی امکان بررسی صحت اطلاعات را فراهم میسازند و به این ترتیب میتوان به دادههای موجود بهطور کامل اطمینان داشت. یکی از اصلیترین توصیههایب که در این پژوهش آمده است، بهبود فرایند و کیفیت الگوی کنونی مورد استفاده برای بهاشتراکگذاری دادهها بود. یکی از پیشنهادات مطرح شده در راستای این هدف، قرار دادن الگوریتم بر روی خودِ دادهها است. این پژوهشگران در توضیح این مفهوم پیشنهادی میگویند:
منظور این است که الگوریتم (یا همان کوئری) در موقعیت قرارگیریِ (یعنی محل ذخیره) دادهها اجرا شود. این بدان معناست که دادههای خام نباید از محل ذخیره خارج شوند و هر نوع دسترسی به آنها باید توسط مدیریت دادهها و یا موقعیت ذخیره آنها مدیریت شود.
گلدمن ساش (Goldman Sachs)
تام دونلاپ (Tom Dunlap) یکی از کارشناسان برجستهای است که فعالیتهای زیادی را طی بیش از یک دهه در زمینهی اطمینان از درستی دادهها و استانداردسازی آنها به انجام رسانده است. او مدتی است به عنوان مدیر ارشد گلدمن ساش (Goldman Sachs) فعالیت دارد. او سالها در این شرکت به عنوان مدیر واحد استراتژی دادهها فعالیت داشت. همچنین در شورای دیجیتالیسازی دادهها و نیز مدیریت اصلاحات مالی این شرکت نیز فعالیت کرده است و عضو کمیتهی مشورتی پژوهشهای مالی در ادارهی خزانهداری ایالات متحده نیز به شمار میرود.
آقای دونلاپ با تکیه بر سالها تجربهی فعالیت در پستهای حساس و مرتبط با امور مالی، چشماندازی را در خصوص ایجاد اعتماد در فرآیند ذخیره و تبادل دادهها و اطمینان از صحت آنها ترسیم کرده است. او بر این باور است که صنعت خدمات مالی در مسیر افزایش کیفیت دادهها و نیز افزایش درستی آنها حرکت میکند. او میگوید:
همهی شرکتها و سازمانهای فعال در حوزهی خدمات مالی، دادهها را مانند یک دارایی سازمانی میبینند. دادهها بهعنوان عنصری بنیادین نه فقط برای پایبندی به مقررات حاکمیتی، بلکه بهبود تجربهی مشتری و نیز افزایش توانایی سازمان برای تدوین طرحهای تجاری در نظر گرفته میشوند.
دونلاپ از «شناسه قانونی نهادها» (LEI) بهعنوان مثال نام میبرد. این شناسه برای هر شرکت و سازمان منحصربهفرد بوده و در تراکنشهای مالی برای تعیین هویت به کار میرود. امروزه شرکتهای خدمات مالی از این شناسه برای مدیریت نظاممند ریسک استفاده میکنند. شرکتهای خدمات مالی مسیر ایجاد دادهها را نیز بررسی میکنند تا به این ترتیب بتوانند بخشهایی از فرایندی که داده در آن استفاده شده یا تغییر یافته را شناسایی و مدیریت کنند. هدف از این کار، اطمینانیابی از صحت دادهها و جلوگیری از مشکلات ناشی از دادههای نادرست است. هر قدر کیفیت دادهها بالاتر باشد، بازهی زمانی عرضهی محصول به بازار کاهش مییابد، فرایند قیمتگذاری و تعیین اطلاعات محصول سادهتر میشود و اجرای انواع عملیات تجاری نیز با سرعت بیشتری صورت میگیرد. همهی این موارد سبب بهبود تجربهی مشتریان و افزایش رضایت آنها میشود.
با رشد چشمگیر حجم دادهها، تنوع دستهبندی دادهها نیز افزایش مییابد. به این ترتیب، آنچه در اصطلاحِ علوم کامپیوتری «داده غیرساختارمند» (unstructured data) نامیده میشود نیز بیشتر میشود. هر نوع سند، تصویر، متن یا هر فایل دیگری که ساختار اطلاعات موجود در آن دستهبندی نشده باشد و برای الگوریتم موجود در سامانه قابل شناسایی نباشد را داده غیرساختارمند میگویند. مدیریت این نوع داده، چالشی کاملا جدی است. بااینحال، هوش مصنوعی و نیز یادگیری ماشینی به ما امکان مدیریت این نوع داده را میدهد.
آقای دونلاپ از «قراردادهای مشتقه» (derivative contracts) بهعنوان مثالی از دادههای غیرساختارمند نام میبرد.
قالب و ساختار این قراردادها برای نهادهای مختلف مالی متفاوت است و تقریبا هیچکدام از آنها از یک الگوی یکسان برای این قراردادها استفاده نمیکنند. در این میان میتوان از هوش مصنوعی و قابلیت یادگیری ماشینی برای کاوش خودکار متون این قراردادها، شناسایی مؤلفههای کلیدی داده (نظیر نام سازمان یا شرایط قرارداد) استفاده کرد. شرکتهای زیادی هستند که از هوش مصنوعی و یادگیری ماشینی برای جستجو در میان دادهها، انجام ترجمهی ماشینی، بررسی شناسهی قانونی نهادها و ارائهی خروجی از نتایج به دست آمده استفاده میکنند. دقت و جامعیت دادههای به دست آمده معمولا بالاست. با گذشت زمان، دقت هوش مصنوعی و الگوریتمهای یادگیری در یافتن اطلاعات مورد نیاز، شناسایی موقعیت آنها و نیز ارائهی توصیههایی برای بهبود دادهها افزایش مییابد. فرایند شناسایی اطلاعات توسط هوش مصنوعی و یادگیری ماشینی در گذشته ممکن بود یک روز کامل وقت بگیرد، اما اکنون این کار طی چند دقیقه و حتی گاهی چند ثانیه انجام میشود.
دیوید شیرر (David Shrier)
اما بلاک چین الگویی متفاوت را برای دسترسی به دادهها پیشنهاد میکند که البته موجب افزایش اعتمادبه کیفیت دادهها نیز میشود. دیوید شیرر (David Shrier) یکی از پیشگامان در حوزهی دادههای مورد اعتماد است. او علاوه بر اینکه در کمیسیون مؤسسه فناوری ماساچوست (MIT) در تدوین سند راهبردی دادههای مورد اعتماد مشارکت کرده است، استاد مدیا لبِ امآیتی (MIT Media Lab)، عضو مشاور ادارهی تنظیم مقررات صنعت مالی ایالات متحده (FINRA) و نیز متخصص آیندهپژوهی نیز هست و در پروژههای مختلفی در زمینهی بلاک چین همکاری داشته است. آقای شیرر میگوید:
بلاک چین یک شکل کاملا متفاوت از پایگاه داده است که میتواند شفافیت بیشتری را برای محیطهای دارای چندین ذینفع فراهم کند. اگر برخی از انواع بلاک چین با سایر فناوریها ترکیب شوند، دادههای موجود در آن از امنیت بیشتری در برابر مشکلات سایبری برخوردار خواهد بود. مفاهیمی قدیمی نظیر دریاچهی اطلاعات، انبار اطلاعات یا بازار اطلاعات بر مبنای الگوی پایگاههای دادهی متمرکز شکل گرفتهاند. این الگو امنیت بالایی نداشته و از جذابیت زیادی برای هکرها برخوردار است.
آقای شیرر در ادامه میگوید:
ما در آغاز راه شناخت ظرفیتهای بلاک چین برای ایجاد تحول در جامعه هستیم. بلاک چین میتواند به شکلگیری شکلی جدید از تأمین مالی و یا شکلگیری سرمایهی توزیع شده برای شرکتها از طریق آنچهعرضه اولیه سکه (ICO) نامیده میشود بیانجامد. این امر بهویژه برای کشورهای اروپایی از اهمیت بیشتری برخوردار است. امروزه حدود ۷۰ درصد از موارد تأمین مالی صورت گرفته برای کسبوکارها از طریق نظام بانکی صورت میگیرد. در ایالات متحده، بیشتر سرمایهگذاریهای صورت گرفته در زمینهی نوآوری در «سیلیکون ولی» متمرکز است. عرضه اولیه سکه (ICO) میتواند الگوی تأمین مالی نوآوری را دموکراتیزه کند، البته به شرطی که نهادهای قانونی نخواهند با این شیوه به مخالفت برخیزند.
دیوید شیرر در توضیح بیشتر مزایای بلاک چین میگوید:
مشتریان از طریق بلاک چین میتوانند به هویت دیجیتالی بهتر، هزینهی کمتر خدمات مالی، الگوهای جدید اشتغال و تعامل، کنترل بهتر داراییها و موارد ارزشمند دیگر دست یابند. البته هنوز در مراحل اولیهی طرح کاربردهای بلاک چین برای مصرفکنندگان قرار داریم. در سال ۱۹۹۴ که آغاز دوران اینترنت بود، هیچکس فکر نمیکرد که روزی به ایربیانبی و اوبر برسیم. فکر میکنم اکنون در مرحلهای مشابه از فناوری بلاک چین به سر میبریم.
بزرگترین مسأله در مسیر استفاده از دادههای شخصی در دنیای امروز به نامشخص بودن محل ذخیرهی آنها، مشخص نبودن کسانی که به این اطلاعات دسترسی دارند و اقداماتی که روی آنها صورت میگیرد مربوط میشود. با وجود اینکه مقررات جدید مربوط به حفاظت از دادهها که توسط اتحادیهی اروپا تدوین شده برای حل این مسائل بوده است، هنوز به زیرساختهای فناوری که به ما امکان بهاشتراکگذاری دادههای مورد اعتماد را میدهد نیاز داریم. پروژه «اعتماد داده امآیتی» (MIT Trust Data) که از فناوری بلاک چین بهره میبرد، چهارچوبی برای ذخیرهی اطلاعات به شکلی ایمن فراهم میسازد.
این سامانه مزایای زیر را به همراه دارد:
۱- ذخیرهی امنتر اطلاعات فردی
۲- دسترسی بهتر به دادهها از طریق ذخیرهی اطلاعات به صورت فردی
۳- مشخص بودن هر نوع دستکاری و استفاده از اطلاعات فردی
آقای شیرر در جمعبندی سخنان خود میگوید:
جامعه بهطورکلی میتواند از دادهها و اطلاعات توزیع شده و قابل اطمینان بهره ببرد. در دورانی که انبوهی از اخبار ساختگی و مداخلهی حکومتها در انتخابات در آن وجود دارد، ایجاد یک نظام اعتماد بر بستر فناوری میتواند اطمینانی دوباره را به نهادهای عمومی بازگرداند.
منبع: forbes
هوش مصنوعی، یادگیری ماشینی و بلاک چین: ابزارهایی برای افزایش اعتماد در دادهها
اعتماد و شفافیت در بلاک چینبلاک چین و اعتماد سازیداده های قابل اعتماد با بلاک چینهوش مصنوعی و مدیریت داده ها
نظرات
ارسال نظر