Je! Ni teknolojia gani ya kunyonya data na suluhisho katika broker ya pakiti ya mtandao?

1. Wazo la upigaji data

Masking ya data pia inajulikana kama masking ya data. Ni njia ya kiufundi kubadilisha, kurekebisha au kufunika data nyeti kama nambari ya simu ya rununu, nambari ya kadi ya benki na habari nyingine wakati tumetoa sheria na sera za masking. Mbinu hii hutumiwa kimsingi kuzuia data nyeti kutoka kutumiwa moja kwa moja katika mazingira yasiyoaminika.

Kanuni ya Kuweka Takwimu: Uwekaji wa data unapaswa kudumisha sifa za asili za data, sheria za biashara, na umuhimu wa data ili kuhakikisha kuwa maendeleo, upimaji, na uchambuzi wa data hautaathiriwa na masking. Hakikisha uthabiti wa data na uhalali kabla na baada ya kufunga.

2. Uainishaji wa data

Masking ya data inaweza kugawanywa katika masking ya data ya tuli (SDM) na nguvu ya data ya nguvu (DDM).

Masking ya data tuli (SDM): Masking ya data tuli inahitaji uanzishwaji wa hifadhidata mpya ya mazingira isiyo ya uzalishaji kwa kutengwa na mazingira ya uzalishaji. Takwimu nyeti hutolewa kutoka kwa hifadhidata ya uzalishaji na kisha kuhifadhiwa kwenye hifadhidata isiyo ya uzalishaji. Kwa njia hii, data iliyokataliwa imetengwa kutoka kwa mazingira ya uzalishaji, ambayo inakidhi mahitaji ya biashara na inahakikisha usalama wa data ya uzalishaji.

SDM

Nguvu ya data ya nguvu (DDM): Kwa ujumla hutumiwa katika mazingira ya uzalishaji ili kukata data nyeti kwa wakati halisi. Wakati mwingine, viwango tofauti vya masking vinahitajika kusoma data nyeti sawa katika hali tofauti. Kwa mfano, majukumu na ruhusa tofauti zinaweza kutekeleza miradi tofauti ya masking.

DDM

Kuripoti data na Matumizi ya Bidhaa za data

Vipimo kama hivyo ni pamoja na bidhaa za ufuatiliaji wa data za ndani au bodi ya bodi, bidhaa za data za huduma ya nje, na ripoti kulingana na uchambuzi wa data, kama ripoti za biashara na ukaguzi wa mradi.

Takwimu za kuripoti masking ya bidhaa

3. Suluhisho la Kuweka Takwimu

Miradi ya kawaida ya kujumuisha data ni pamoja na: Udhibiti, thamani ya nasibu, uingizwaji wa data, usimbuaji wa ulinganifu, thamani ya wastani, kukabiliana na kuzungusha, nk.

Batili: Batili inahusu usimbuaji, truncation, au mafichoni ya data nyeti. Mpango huu kawaida huchukua nafasi ya data halisi na alama maalum (kama *). Operesheni ni rahisi, lakini watumiaji hawawezi kujua muundo wa data ya asili, ambayo inaweza kuathiri matumizi ya data inayofuata.

Thamani isiyo ya kawaida: Thamani ya bahati nasibu inahusu uingizwaji wa data nyeti (nambari hubadilisha nambari, herufi zinabadilisha herufi, na wahusika hubadilisha herufi). Njia hii ya masking itahakikisha muundo wa data nyeti kwa kiwango fulani na kuwezesha programu ya data inayofuata. Kamusi za Masking zinaweza kuhitajika kwa maneno kadhaa yenye maana, kama vile majina ya watu na mahali.

Uingizwaji wa data: Uingizwaji wa data ni sawa na maski ya maadili yasiyofaa na ya bahati nasibu, isipokuwa kwamba badala ya kutumia herufi maalum au maadili ya bahati nasibu, data ya masking inabadilishwa na thamani fulani.

Usimbuaji wa ulinganifu: Usimbuaji wa ulinganifu ni njia maalum ya kubadili nyuma. Inasimba data nyeti kupitia funguo za usimbuaji na algorithms. Fomati ya ciphertext inaambatana na data ya asili katika sheria za kimantiki.

Wastani: Mpango wa wastani mara nyingi hutumiwa katika hali za takwimu. Kwa data ya nambari, kwanza tunahesabu maana yao, na kisha kusambaza kwa nasibu maadili yaliyokataliwa karibu na maana, na hivyo kuweka jumla ya data mara kwa mara.

Kukabiliana na kuzungushaNjia hii inabadilisha data ya dijiti kwa kuhama bila mpangilio. Mzunguko wa kukabiliana na inahakikisha ukweli wa takriban wa anuwai wakati unadumisha usalama wa data, ambayo iko karibu na data halisi kuliko miradi ya zamani, na ina umuhimu mkubwa katika hali ya uchambuzi mkubwa wa data.

ML-NPB-5660- 数据脱敏

Mfano wa kupendekeza "ML-NPB-5660"Kwa uainishaji wa data

4. Mbinu za kawaida za upigaji data

(1). Mbinu za takwimu

Sampuli ya data na mkusanyiko wa data

- Sampuli ya data: Uchambuzi na tathmini ya data ya asili iliyowekwa kwa kuchagua sehemu ndogo ya mwakilishi wa seti ya data ni njia muhimu ya kuboresha ufanisi wa mbinu za kitambulisho.

- Mkusanyiko wa data: Kama mkusanyiko wa mbinu za takwimu (kama vile DRM, kuhesabu, wastani, kiwango cha juu na cha chini) kinachotumika kwa sifa katika microdata, matokeo yake ni mwakilishi wa rekodi zote kwenye seti ya data ya asili.

(2). Crystalgraphy

Crystalgraphy ni njia ya kawaida ya kukata tamaa au kuongeza ufanisi wa kukata tamaa. Aina tofauti za algorithms za usimbuaji zinaweza kufikia athari tofauti za kukata tamaa.

- Uainishaji wa usimbuaji: usimbuaji wa ulinganifu usio wa bahati nasibu. Kawaida husindika data ya kitambulisho na inaweza kuachana na kurejesha muundo wa kitambulisho cha asili wakati inahitajika, lakini ufunguo unahitaji kulindwa vizuri.

- Usimbuaji usiobadilika: Kazi ya hashi hutumiwa kusindika data, ambayo kawaida hutumiwa kwa data ya kitambulisho. Haiwezi kuchafuliwa moja kwa moja na uhusiano wa ramani lazima uokolewe. Kwa kuongezea, kwa sababu ya kipengele cha kazi ya hash, mgongano wa data unaweza kutokea.

- Usimbuaji wa homomorphic: algorithm ya homomorphic hutumiwa. Tabia yake ni kwamba matokeo ya operesheni ya ciphertext ni sawa na ile ya operesheni ya wazi baada ya kuharibika. Kwa hivyo, hutumiwa kawaida kusindika uwanja wa nambari, lakini haitumiki sana kwa sababu za utendaji.

(3). Teknolojia ya Mfumo

Teknolojia ya kukandamiza inafuta au inalinda vitu vya data ambavyo havifikii kinga ya faragha, lakini havichapishi.

- Masking: Inahusu njia ya kawaida ya kukata tamaa ya kuficha thamani ya sifa, kama nambari ya mpinzani, kadi ya kitambulisho imewekwa alama na asterisk, au anwani imepunguzwa.

- Kukandamiza kwa ndani: inahusu mchakato wa kufuta maadili maalum ya sifa (safu), kuondoa sehemu za data zisizo muhimu;

- Rekodi ya kukandamiza: inahusu mchakato wa kufuta rekodi maalum (safu), kufuta rekodi za data zisizo muhimu.

(4). Teknolojia ya Pseudonym

Pseudomanning ni mbinu ya kitambulisho ambayo hutumia pseudonym kuchukua nafasi ya kitambulisho cha moja kwa moja (au kitambulisho kingine nyeti). Mbinu za kujulikana zinaunda vitambulisho vya kipekee kwa kila somo la habari la mtu binafsi, badala ya vitambulisho vya moja kwa moja au nyeti.

- Inaweza kutoa maadili ya nasibu kwa kujitegemea ili kuambatana na kitambulisho cha asili, kuokoa meza ya ramani, na kudhibiti kabisa ufikiaji wa meza ya ramani.

- Unaweza pia kutumia encryption kutoa pseudonyms, lakini unahitaji kuweka ufunguo wa decryption vizuri;

Teknolojia hii inatumika sana katika kesi ya idadi kubwa ya watumiaji wa data huru, kama vile OpenID katika hali ya wazi ya jukwaa, ambapo watengenezaji tofauti hupata fursa tofauti kwa mtumiaji mmoja.

(5). Mbinu za jumla

Mbinu ya ujanibishaji inahusu mbinu ya kitambulisho ambayo hupunguza granularity ya sifa zilizochaguliwa katika seti ya data na hutoa maelezo ya jumla na ya kawaida ya data. Teknolojia ya jumla ni rahisi kutekeleza na inaweza kulinda uhalisi wa data ya kiwango cha rekodi. Inatumika kawaida katika bidhaa za data au ripoti za data.

- Kuzunguka: inajumuisha kuchagua msingi wa kuzunguka kwa sifa iliyochaguliwa, kama vile uchunguzi wa juu au wa chini, kutoa matokeo 100, 500, 1k, na 10k

- Mbinu za juu na za chini za kuweka alama: Badilisha maadili hapo juu (au chini) kizingiti na kizingiti kinachowakilisha kiwango cha juu (au chini), kutoa matokeo ya "juu x" au "chini ya x"

(6). Mbinu za ujanibishaji

Kama aina ya mbinu ya kitambulisho, teknolojia ya ujanibishaji inahusu kurekebisha thamani ya sifa kupitia ujanibishaji, ili thamani baada ya ujanibishaji ni tofauti na thamani halisi ya asili. Utaratibu huu unapunguza uwezo wa mshambuliaji kupata thamani ya sifa kutoka kwa maadili mengine ya sifa katika rekodi hiyo hiyo ya data, lakini inaathiri ukweli wa data inayosababishwa, ambayo ni kawaida na data ya mtihani wa uzalishaji.


Wakati wa chapisho: SEP-27-2022