Jak używać wstępnie zdefiniowanych wzorców do wykrywania treści

Reguły zapobiegania utracie danych (DLP) są stosowane tylko do użytkowników G Suite Enterprise oraz G Suite dla Szkół i Uczelni

Funkcja DLP w Gmailu jest teraz dostępna tylko w G Suite Enterprise oraz G Suite dla Szkół i Uczelni. Jeśli masz licencję na G Suite Business kupioną przed 31 marca 2017 roku, możesz nadal korzystać z funkcji DLP w Gmailu do 31 stycznia 2020 roku, pod warunkiem, że licencja na G Suite Business będzie cały czas aktywna.

Jako administrator podczas konfigurowania reguły zapobiegania utracie danych możesz użyć wzorców do wykrywania treści, aby określić rodzaje poufnych danych, które mają być wykrywane i oznaczane. Niektóre szablony reguł zawierają wstępnie zdefiniowane wzorce do wykrywania treści, które automatycznie wykrywają i oznaczają poufne dane. Sposób wykrywania i oznaczania treści zależy od jej rodzaju.

Metody wykrywania

Wstępnie zdefiniowane wzorce do wykrywania treści są tworzone przy użyciu publicznie dostępnych informacji. Cztery główne metody wykrywania to: dopasowanie do wzorca, kontekst, suma kontrolna oraz lista słów i wyrażeń. Wzorzec oznacza treść w przypadku znalezienia poufnej treści tylko przez jedną metodę lub wszystkie metody. 

  • Dopasowanie do wzorca – określony wzorzec alfanumeryczny (nie tylko długość ciągu) obejmujący separatory, pozycję i sprawdzanie zakresów

  • Kontekst – obecność pasujących ciągów w pobliżu wzorca i/lub ciąg odpowiadający sumie kontrolnej 
  • Suma kontrola – obliczanie i weryfikacja sumy kontrolnej z cyfrą kontrolną
  • Lista słów i wyrażeń – pełne lub częściowe dopasowanie do wpisu dostępnego w słowniku wyrażeń i słów

Wstępnie zdefiniowane wzorce do wykrywania treści

Stany Zjednoczone
Wzorzec do wykrywania treści Opis
Numer ubezpieczenia społecznego

Obywatele oraz tymczasowi i stali mieszkańcy Stanów Zjednoczonych otrzymują dziewięciocyfrowy numer ubezpieczenia społecznego (Social Security number – SSN). Ten numer w rzeczywistości jest używany jako krajowy numer identyfikacyjny do celów podatkowych i innych.

Metoda wykrywania: dopasowanie do wzorca lub obecność dziewięciu cyfr w odpowiednim kontekście

Kontekst: SSN, społeczny, ubezpieczenie społeczne, płatnik podatków

 

Numer prawa jazdy

Numer prawa jazdy wydanego w Stanach Zjednoczonych. Dokładny format jest uzależniony od stanu, w którym dokument został wydany.

Metoda wykrywania: dopasowanie do wzorca i kontekst

Kontekst: jechać, jazda, nauka, licencja, rejestracja, uprawnienie, prawo, PJ

Numer rejestracji DEA (Drug Enforcement Administration – agencja ds. ochrony przed narkotykami)

Numer rejestracji DEA jest przyznawany placówkom zapewniającym opiekę zdrowotną przez amerykańską agencję ds. ochrony przed narkotykami. Umożliwia on tym placówkom wydawanie recept na substancje objęte regulacjami. Numer rejestracji DEA jest często używany jako ogólny „numer wystawcy recepty”, czyli unikatowy identyfikator podmiotu upoważnionego do wydawania recept na leki.

Metoda wykrywania: dopasowanie do wzorca i suma kontrolna

Numer rozliczeniowy ABA

Numer rozliczeniowy ABA (American Bankers Association – amerykańskie stowarzyszenie bankowe) jest też czasami nazywany numerem przesyłowym. Jest to dziewięciocyfrowy kod używany do identyfikowania instytucji finansowej odpowiedzialnej za pobranie lub otrzymanie środków w ramach czeku lub transakcji elektronicznej.

Metoda wykrywania: suma kontrolna dziewięciu cyfr

Identyfikator NPI (National Provider Identifier – krajowy identyfikator opieki zdrowotnej)

Identyfikator NPI to unikalny dziesięciocyfrowy numer przyznawany placówkom zapewniającym opiekę zdrowotną w Stanach Zjednoczonych przez organizację Centers for Medicare and Medicaid Services (CMS). Identyfikator NPI zastąpił unikalny numer identyfikacyjny placówek zapewniających opiekę zdrowotną UPIN jako wymaganą formę identyfikacji dla usług w ramach programu Medicare. Jest on też używany przez innych płatników, w tym przez komercyjnych ubezpieczycieli zdrowotnych.

Metoda wykrywania: suma kontrolna dziesięciu cyfr

 

CUSIP CUSIP to składający się z dziewięciu znaków kod alfanumeryczny, który identyfikuje zabezpieczenia finansowe w Ameryce Północnej. 

Metoda wykrywania: suma kontrolna lub kontekst (jeśli cyfra kontrolna jest niedostępna)

Kontekst: CUSIP

Lista leków dostępnych na receptę FDA Lista leków dostępnych na receptę zatwierdzonych przez amerykańską agencję FDA (Food and Drug Administration – agencja ds. żywności i leków).

Metoda wykrywania: lista słów i wyrażeń

Paszport

Wzorzec do wykrywania paszportu Stanów Zjednoczonych.

Metoda wykrywania: dopasowanie do wzorca i kontekst

Kontekst: Stany Zjednoczone, USA, paszport, dokument podróży

Wielka Brytania
Wzorzec do wykrywania treści Opis
Numer prawa jazdy

Numer prawa jazdy wydanego w Zjednoczonym Królestwie Wielkiej Brytanii i Irlandii Północnej.

Metoda wykrywania: dopasowanie do wzorca

Numer NHS (National Health Service – narodowa służba zdrowia)

NHS to unikalny numer przyznawany zarejestrowanym użytkownikom trzech publicznych organizacji służby zdrowia w Anglii, Walii i na Wyspie Man.

Metoda wykrywania: dopasowanie do wzorca i suma kontrolna

 

Numer NINO (National Insurance Number – krajowy numer ubezpieczenia)

Numer NINO jest używany w Wielkiej Brytanii na potrzeby administrowania ubezpieczeniami krajowymi i systemem opieki społecznej. Jest on przyznawany indywidualnym osobom. Czasami jest on też używany do rozliczeń podatkowych w Wielkiej Brytanii. Czasami jest on też określany jako NI No.

Metoda wykrywania: dopasowanie do wzorca (z separatorami) lub dopasowanie do wzorca i wyrazy kontekstu

 

Paszport

Wzorzec do wykrywania paszportu Wielkiej Brytanii.

Metoda wykrywania: dopasowanie do wzorca i kontekst

Kontekst: Wielka Brytania, paszport, dokument podróży

Numer identyfikacyjny podatnika

Wzorzec do wykrywania unikatowych numerów referencyjnych podatników z Wielkiej Brytanii (UTR – Unique Taxpayer Reference Number). Takie numery złożone z dziesięciu cyfr są używane przez rząd Wielkiej Brytanii do zarządzania systemem podatkowym. W odróżnieniu od innych identyfikatorów, takich jak numery paszportów lub ubezpieczenia społecznego, numer UTR nie jest drukowany na oficjalnych dokumentach tożsamości.

Metoda wykrywania: dopasowanie do wzorca i kontekst

Kontekst: Wielka Brytania, podatnik, UTR

Australia
Wzorzec do wykrywania treści Opis
Numer konta opieki zdrowotnej

Dziewięciocyfrowy numer konta opieki zdrowotnej wydawany stałym mieszkańcom Australii (z wyjątkiem wyspy Norfolk). Podstawowym celem tego numeru jest potwierdzenie uprawnień do otrzymywania dofinansowanej opieki zdrowotnej w Australii.

Metoda wykrywania: suma kontrolna oraz dopasowanie do wzorca lub kontekst

Kontekst: opieka zdrowotna, Australia, IRN

Numer identyfikacji podatkowej (TFN)

Numer wydawany przez australijski urząd podatkowy na potrzeby identyfikacji podatników. Każdy podmiot zobowiązany do płacenia podatków, na przykład osoba prywatna lub organizacja, otrzymuje unikatowy numer TFN.

Metoda wykrywania: suma kontrolna oraz dopasowanie do wzorca lub kontekst

Kontekst: numer identyfikacji podatkowej, TFN, australijski urząd podatkowy

Brazylia
Wzorzec do wykrywania treści Opis
Numer CPF

CPF (Cadastro de Pessoas Físicas, co z portugalskiego „powszechny rejestr osób”) to jedenastocyfrowy numer używany w Brazylii na potrzeby identyfikacji podatników.

Metoda wykrywania: suma kontrolna oraz dopasowanie do wzorca lub kontekst

Kontekst: CPF, Cadastro de Pessoas Físicas, Pessoas Físicas, numer podatkowy, płatnik podatków

Kanada
Wzorzec do wykrywania treści Opis
Numer ubezpieczenia zdrowotnego w regionie Quebec (HIN – Health Insurance Number)

Numer HIN jest przyznawany obywatelom, stałym mieszkańcom, pracownikom tymczasowym, uczniom i studentom oraz innym osobom, które są uprawnione do opieki zdrowotnej w prowincji Quebec.

Metoda wykrywania: dopasowanie do wzorca

 

Numer ubezpieczenia zdrowotnego w regionie Ontario (OHIP – Ontario Health Insurance Plan)

Numer OHIP jest przyznawany obywatelom, stałym mieszkańcom, pracownikom tymczasowym, uczniom i studentom oraz innym osobom, które są uprawnione do opieki zdrowotnej w prowincji Ontario.

Metoda wykrywania: dopasowanie do wzorca i suma kontrolna

 

Numer ubezpieczenia zdrowotnego w regionie Kolumbia Brytyjska (PHN – Personal Health Number)

Numer PHN jest przyznawany obywatelom, stałym mieszkańcom, pracownikom tymczasowym, uczniom i studentom oraz innym osobom, które są uprawnione do opieki zdrowotnej w prowincji Kolumbia Brytyjska.

Metoda wykrywania: dopasowanie do wzorca lub obecność dziesięciu cyfr w odpowiednim kontekście

Kontekst: BC ID, PHN, Kolumbia Brytyjska, osobisty numer ubezpieczenia, karta usług, kanadyjski numer ubezpieczenia zdrowotnego, kanadyjski identyfikator zdrowotny

 

Numer ubezpieczenia społecznego (SIN – Social Insurance Number)

Kanadyjski numer ubezpieczenia zdrowotnego to główny identyfikator obywateli Kanady, stałych mieszkańców i osób posiadających wizy związane z pracą lub edukacją. Numer SIN i adres pocztowy na terytorium Kanady uprawniają do ubiegania się o pełną opiekę zdrowotną, prawo jazdy i inne ważne usługi.

Metoda wykrywania: suma kontrolna oraz dopasowanie do wzorca lub kontekst

 

Paszport

Wzorzec do wykrywania kanadyjskiego paszportu.

Metoda wykrywania: dopasowanie do wzorca i kontekst

Kontekst Kanada, kanadyjski, Numéro de passeport, paszport, dokument podróży, numer dokumentu

Chiny
Wzorzec do wykrywania treści Opis
Paszport

Wzorzec do wykrywania chińskiego paszportu.

Metoda wykrywania: dopasowanie do wzorca i kontekst

Kontekst: Chiny, paszport, 中华人民共和国护照, 护照号, Hùzhào hào, 护照

Francja
Wzorzec do wykrywania treści Opis
Dowód tożsamości (CNI)

Carte Nationale d’Identité Sécurisée (CNI lub CNIS) to francuski dowód tożsamości. To oficjalny dokument potwierdzający tożsamość, który jest oznaczony dwunastocyfrowym numerem identyfikacyjnym. Jest on zwykle używany podczas otwierania rachunków bankowych i płacenia przy użyciu czeków. Może zastąpić paszport i wizę w Unii Europejskiej oraz kilku innych krajach.

Metoda wykrywania: dopasowanie do wzorca i kontekst

Kontekst: CNI, CNIS (carte nationale d'identité securisée), identité, identite

Numer ubezpieczenia społecznego (NIR)

Numéro d'Inscription au Répertoire (NIR) to stały osobisty numer identyfikacyjny, który jest też określany jako francuski numer ubezpieczenia społecznego. Umożliwia on między innymi korzystanie z opieki zdrowotnej oraz otrzymywanie zasiłków i rent.

Metoda wykrywania: dopasowanie do wzorca i suma kontrolna

Paszport

Wzorzec do wykrywania francuskiego paszportu.

Metoda wykrywania: dopasowanie do wzorca i kontekst

Kontekst: Francja, paszport, Passeport, REPUBLIC FRANCAIS, Numéro de passeport

Niemcy
Wzorzec do wykrywania treści Opis
Paszport

Wzorzec do wykrywania niemieckiego paszportu. Format numeru niemieckiego paszportu to dziesięć znaków alfanumerycznych, w których skład wchodzą cyfry od zera do dziewięciu i litery C, F, G, H, J, K, L, M, N, P, R, T, V, W, X, Y, Z.

Metoda wykrywania: dopasowanie do wzorca i kontekst

Kontekst: NIEMCY, REISEPASS, PASSPORT, Europäische Union, Bundesrepublik, Deutschland, reisepassnummer

Indie
Wzorzec do wykrywania treści Opis
Stały numer konta osobowego (PAN)

Numer PAN to unikatowy dziesięcioznakowy identyfikator alfanumeryczny wydawany osobom, przede wszystkim płatnikom podatku dochodowego. Jest on wydawany przez indyjski departament podatkowy. Numer PAN jest ważny przez całe życie jego posiadacza.

Metoda wykrywania: dopasowanie do wzorca i kontekst

Kontekst: Indie, numer konta, PAN, identyfikator płatnika podatków

Japonia
Wzorzec do wykrywania treści Opis
Paszport

Wzorzec do wykrywania japońskiego paszportu. Numer paszportu składa się z dwóch znaków alfanumerycznych i siedmiu cyfr.

Metoda wykrywania: dopasowanie do wzorca i kontekst

Kontekst: Japonia, paszport, パスポート,
パスポート番号

Korea
Wzorzec do wykrywania treści Opis
Paszport

Wzorzec do wykrywania koreańskiego paszportu. Istnieją dwa różne formaty.

Numery paszportów sprzed 2008 roku składają się z dziewięciu znaków. Pierwsze dwa znaki to wydany kod lokalny odpowiadający gu (dzielnicy) właściciela paszportu. Pozostałe siedem cyfr to numer seryjny.

Numery paszportów wydanych po 2008 roku składają się z dziewięciu znaków. Pierwszy znak to pojedyncza litera M w przypadku paszportów PM lub litera S w przypadku paszportów PS. Pozostałe osiem cyfr to numer seryjny.

Metoda wykrywania: dopasowanie do wzorca i kontekst

Kontekst: paszport, Korea, 여권, 대한민국

Meksyk
Wzorzec do wykrywania treści Opis
Krajowy numer identyfikacyjny (CURP)

Wzorzec do wykrywania numeru Mexico Clave Única de Registro de Población („CURP”), czyli unikalnego kodu w rejestrze populacji (numeru kodu identyfikacji osobistej). CURP to składający się z 18 znaków numer identyfikacyjny wydawany przez rząd meksykański obywatelom i mieszkańcom Meksyku, który jest używany do identyfikacji podatnika.

Metoda wykrywania: dopasowanie do wzorca i kontekst

Kontekst: CURP, Clave Única, Población, Registro, UPRC, identyfikacja osobista, kod w rejestrze

Paszport

Wzorzec do wykrywania meksykańskiego paszportu.

Metoda wykrywania: dopasowanie do wzorca i kontekst

Kontekst: Meksyk, paszport, Pasaporte, México, meksykański

Holandia
Wzorzec do wykrywania treści Opis
Krajowy numer identyfikacyjny (BSN)

Wzorzec do wykrywania holenderskiego numeru identyfikacyjnego. Ten numer określany jest też jako „numer usług społecznych”. Jest on wydawany urzędowo i drukowany na prawach jazdy, paszportach i międzynarodowych dokumentach tożsamości.

Metoda wykrywania: suma kontrolna oraz dopasowanie do wzorca lub kontekst

Kontekst: BSN, numer osobisty, Burgerservicenummer, Holandia, numer identyfikacyjny, numer usług, sofinummer, sofi, personalnummer

Hiszpania
Wzorzec do wykrywania treści Opis
Numer NIF

Numery NIF (“Número de Identificación Fiscal”) to rządowe numery identyfikacyjne obywateli Hiszpanii. Numer NIF jest potrzebny do najważniejszych transakcji, takich jak otwieranie konta bankowego, kupowanie samochodu czy podpisywanie umowy na abonament telefonii komórkowej.

Metoda wykrywania: suma kontrolna oraz dopasowanie do wzorca lub kontekst

Kontekst: Número de Identificación Fiscal, NIF

 

Numer NIE

Numery NIE (“Número de Identificación de Extranjeros”) to rządowe numery identyfikacyjne dla obcokrajowców mieszkających lub pracujących w Hiszpanii. Numer NIE jest potrzebny do najważniejszych transakcji, takich jak otwieranie konta bankowego, kupowanie samochodu czy podpisywanie umowy na abonament telefonii komórkowej.

Metoda wykrywania: suma kontrolna oraz dopasowanie do wzorca lub kontekst

Kontekst: Número de Identificación de Extranjeros, NIE

 

Paszport

Istnieją cztery różne rodzaje hiszpańskich paszportów. Ten wzorzec służy do wykrywania zwykłego paszportu (Pasaporte Ordinario), który jest wydawany dla osób podróżujących, na przykład na wakacje lub w celach biznesowych.

Metoda wykrywania: dopasowanie do wzorca i kontekst

Kontekst: paszport, Pasaporte, Espana, España, Hiszpania

Cały świat
Wzorzec do wykrywania treści Opis
Numer karty kredytowej

Numery kart kredytowych mają od 12 do 19 cyfr. Pozwalają realizować transakcje finansowe na całym świecie.

Metoda wykrywania: dopasowanie do wzorca i suma kontrolna

 

Numer konta bankowego (IBAN)

Międzynarodowy numer konta bankowego IBAN to uzgodniona międzynarodowa metoda identyfikacji rachunków bankowych. Jest on zdefiniowany w normie International Standard of Organization (ISO) 13616:2007, która została opracowana przez europejski komitet ds. standardów bankowych (European Committee for Banking Standards – ECBS). Numer IBAN składa się z do 34 znaków alfanumerycznych obejmujących kod kraju lub numer rachunku.

Metoda wykrywania: dopasowanie do wzorca i suma kontrolna

Bankowy kod SWIFT

Kod SWIFT jest taki sam jak kod BIC (Bank Identifier Code). Jest to unikatowy identyfikator banku. Kod SWIFT jest używany podczas przesyłania pieniędzy między bankami – zwykle w przypadku przelewów międzynarodowych. Banki używają też kodów wymiany innych informacji.

Metoda wykrywania: dopasowanie do wzorca i kontekst

Kontekst: SWIFT, ISO 9362, kod identyfikatora bankowego, BIC, identyfikator jednostki bankowej, BEI, bank, międzybankowe

Leksykon ICD 9-CM

Leksykon międzynarodowej klasyfikacji chorób i procedur medycznych (International Classification of Diseases, Clinical Modification – ICD-9-CM) ułatwia przypisywanie kodów diagnostycznych i proceduralnych związanych z przyjmowaniem i obsługą pacjentów w USA. Został on utworzony przez amerykański urząd zdrowotnych danych statystycznych (National Center for Health Statistics – NCHS). Leksykon ICD-9-CM powstał na podstawie ICD-9, ale zawiera dodatkowe informacje na temat chorób. Jest on aktualizowany co roku 1 października.

Metoda wykrywania: lista słów i wyrażeń

Leksykon ICD 10-CM

ICD 10 (tak jak ICD 9) to seria kodów diagnostycznych opublikowanych przez Światową Organizację Zdrowia na potrzeby opisu przyczyn chorób i śmiertelności.

Metoda wykrywania: lista słów wyrażeń

Czy to było pomocne?
Jak możemy ją poprawić?