Whiz Tools

Regexi mustri testija

Kopeeri

Vastete tulemused

Sisestage muster ja testtekst, et näha tulemusi

Salvesta muster

Salvestatud mustrid

Ei ole veel salvestatud mustreid

Regexi sümbolite juhend

.Mängib mis tahes märki, välja arvatud reavahetus
\dMängib mis tahes numbrit (0-9)
\DMängib mis tahes mitte-numbrilist
\wMängib mis tahes sõna märki (a-z, A-Z, 0-9, _)
\WMängib mis tahes mitte-sõna märki
\sMängib mis tahes tühikut
\SMängib mis tahes mitte-tühikut
^Mängib rea algust
$Mängib rea lõppu
*Mängib 0 või rohkem eelnevat märki
+Mängib 1 või rohkem eelnevat märki
?Mängib 0 või 1 eelnevat märki
{n}Mängib täpselt n eelnevat märki
{n,}Mängib vähemalt n eelnevat märki
{n,m}Mängib vahemikus n kuni m eelnevat märki
[abc]Mängib ühtegi märkidest sulgudes
[^abc]Mängib mis tahes märki, mis ei ole sulgudes
(abc)Grupib mitu tokenit kokku ja salvestab vastuse
a|bMängib kas a või b
\bMängib sõna piiri positsiooni

Regex Muster Tester ja Validator

Sissejuhatus

Regulaarne väljend (regex) muster tester on hädavajalik tööriist arendajatele, andmeanalüütikutele ja kõigile, kes tegelevad tekstide töötlemisega. See põhjalik regex muster valideerija võimaldab teil luua, testida ja täiustada regulaarseid väljendeid reaalajas, pakkudes kohest visuaalset tagasisidet mustri vastetest. Olgu need e-posti aadresside valideerimine, logifailide analüüsimine või spetsiifiliste andmete eraldamine tekstist, meie regex tester muudab arendamise ja tõrkeotsingu protsessi kiiremaks ja intuitiivsemaks.

Regulaarväljendid on võimsad mustriotsingu järjestused, mis võimaldavad keerulist teksti otsimist, valideerimist ja manipuleerimist. Kuid nende süntaks võib olla keeruline ja raske omandada. See regex muster tester lihtsustab protsessi, tuues esile vasted, kui te kirjutate, valideerides mustri süntaksit ja võimaldades teil salvestada sageli kasutatavaid mustreid tulevaseks viitamiseks.

Kuidas kasutada Regex Muster Testijat

Meie regex muster valideerija kasutamine on lihtne ja intuitiivne. Järgige neid samme, et alustada:

  1. Sisestage regulaarne väljendi muster: Kirjutage oma regex muster määratud sisendvälja. Tööriist valideerib teie mustri reaalajas, teavitades teid kõigist süntaksi vigadest.

  2. Valige regex lipud: Valige oma mustri jaoks sobivad lipud:

    • g (Globaalne): Leidke kõik vasted, mitte ainult esimest
    • i (Suurtähtedeta): Tehke muster suurtähtedeta
    • m (Mitmerealine): Tehke ^ ja $ vastavaks iga rea algusele/lõpule
    • Erinevad kombinatsioonid nendest lippudest on saadaval rippmenüüs
  3. Sisestage testtekst: Sisestage tekst, mida soovite oma mustriga testida, testteksti alasse.

  4. Vaadake tulemusi reaalajas: Kui te kirjutate, tööriist automaatselt:

    • Tõstab esile kõik mustri vasted testtekstis
    • Kuvab leitud vastete koguarvu
    • Näitab, kas muster vastab kogu tekstile
  5. Salvesta kasulikud mustrid: Mustrite jaoks, mida kasutate sageli:

    • Sisestage oma mustri jaoks kirjeldav silt
    • Klõpsake nuppu "Salvesta"
    • Juurdepääs oma salvestatud mustritele "Salvestatud mustrid" sektsioonist
  6. Kopeerige tulemused: Kasutage nuppu "Kopeeri vasted", et kopeerida kõik vasteteks olev tekst oma lõikelauale, et kasutada seda teistes rakendustes.

Liides on jagatud kaheks peamiseks paneeliks: sisendpaneel, kuhu sisestate oma mustri ja testteksti, ning tulemuste paneel, mis kuvab vasted ja mustri teavet.

Regulaarväljendi Alused

Regulaarväljendid kasutavad erimärke ja järjestusi, et määratleda otsingumustreid. Siin on juhend meie tööriiduga toetatud põhielementide kohta:

Mängu Mustrid

SümbolKirjeldusNäideVastab
.Vastab igale märgile, välja arvatud reavahetusa.c"abc", "adc", "a1c" jne.
\dVastab igale numbrile (0-9)\d{3}"123", "456", "789" jne.
\DVastab igale mitte-numbrile\D+"abc", "xyz" jne.
\wVastab igale sõnamärgile (a-z, A-Z, 0-9, _)\w+"abc123", "test_123" jne.
\WVastab igale mitte-sõnamärgile\W+"!@#", " + " jne.
\sVastab igale tühikmärgilea\sb"a b", "a\tb" jne.
\SVastab igale mitte-tühikmärgile\S+"abc", "123" jne.

Positsiooni Ankurid

SümbolKirjeldusNäideVastab
^Vastab rea algusele^abc"abc" rea alguses
$Vastab rea lõpuleabc$"abc" rea lõpus
\bVastab sõna piirile\bword\b"word" kui täis sõna

Kvantifikaatorid

SümbolKirjeldusNäideVastab
*Vastab 0 või rohkem eelnevale märgilea*b"b", "ab", "aab" jne.
+Vastab 1 või rohkem eelnevale märgilea+b"ab", "aab", "aaab" jne.
?Vastab 0 või 1 eelnevale märgilecolou?r"color", "colour"
{n}Vastab täpselt n eelnevale märgilea{3}"aaa"
{n,}Vastab vähemalt n eelnevale märgilea{2,}"aa", "aaa", "aaaa" jne.
{n,m}Vastab n ja m eelnevale märgilea{2,4}"aa", "aaa", "aaaa"

Mängu Klassid

SümbolKirjeldusNäideVastab
[abc]Vastab igale ühele märkidele sulgudes[aeiou]"a", "e", "i", "o", "u"
[^abc]Vastab igale märgile, mis ei ole sulgudes[^aeiou]Iga märk, välja arvatud "a", "e", "i", "o", "u"
[a-z]Vastab igale märgile antud vahemikus[a-z]Iga väike täht

Rühmitamine ja Alternatiiv

SümbolKirjeldusNäideVastab
(abc)Rühmitab mitu tokenit kokku ja salvestab vastuse(abc)+"abc", "abcabc" jne.
a|bVastab kas a-le või b-lecat|dog"cat", "dog"

Täiustatud Regex Mustrid

Kui olete alused omandanud, saate luua keerukamaid mustreid, et lahendada keerulisi tekstide töötlemise väljakutseid:

E-posti Valideerimine

^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}$

See muster valideerib e-posti aadresse, tagades, et need järgivad standardset vormingut: kasutajanimi@domeen.tld.

URL Valideerimine

^(https?:\/\/)?(www\.)?[-a-zA-Z0-9@:%._\+~#=]{2,256}\.[a-z]{2,6}\b([-a-zA-Z0-9@:%_\+.~#?&//=]*)$

See muster valideerib URL-e, sealhulgas neid, millel on või ei ole http/https protokolli.

Telefoninumbri Valideerimine (USA Vorm)

^\(?(\d{3})\)?[- ]?(\d{3})[- ]?(\d{4})$

See muster vastab USA telefoninumbritele erinevates vormides: (123) 456-7890, 123-456-7890 või 1234567890.

Kuupäeva Valideerimine (AAAA-KK-PÄEV)

^\d{4}-(0[1-9]|1[0-2])-(0[1-9]|[12][0-9]|3[01])$

See muster valideerib kuupäevi vormingus AAAA-KK-PÄEV, pakkudes põhivaldkondade valideerimist kuu ja päeva jaoks.

Järelevalve ja Tagasivaatamine

Järelevalve ja tagasivaatamise väidete abil saate mustreid vastata ainult siis, kui need on järgnenud või eelnenud teisele mustrile:

  • Positiivne järelevalve: a(?=b) vastab "a"-le ainult siis, kui see on järgnenud "b"-le
  • Negatiivne järelevalve: a(?!b) vastab "a"-le ainult siis, kui see ei ole järgnenud "b"-le
  • Positiivne tagasivaatamine: (?<=a)b vastab "b"-le ainult siis, kui see on eelnenud "a"-le
  • Negatiivne tagasivaatamine: (?<!a)b vastab "b"-le ainult siis, kui see ei ole eelnenud "a"-le

Regex Lippude Kasutamine

Meie regex tester toetab erinevaid lippe, mis muudavad mustrite vastamist:

  • g (Globaalne): Leidke kõik vasted, mitte ainult esimest
  • i (Suurtähtedeta): Tehke muster suurtähtedeta
  • m (Mitmerealine): Tehke ^ ja $ vastavaks iga rea algusele/lõpule
  • Kombinatsioonid: Saate kombineerida lippe keerukamate vastamisnõuete jaoks

Kasutusalad Regex Muster Testimiseks

Regulaarväljendid omavad arvukalt praktilisi rakendusi erinevates valdkondades:

Veebiarendus

  1. Vormi Valideerimine: Tagage, et kasutaja sisendid vastavad nõutud vormingutele:

    • E-posti aadressid: ^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}$
    • Paroolid (keerukusnõuetega): ^(?=.*[A-Za-z])(?=.*\d)[A-Za-z\d]{8,}$
    • URL-id: ^(https?:\/\/)?([\da-z\.-]+)\.([a-z\.]{2,6})([\/\w \.-]*)*\/?$
  2. HTML Parsimine: Eemaldage spetsiifilised elemendid või atribuudid:

    • Leidke kõik pildimärgid: <img[^>]+src="([^">]+)"
    • Eemaldage lingid: <a[^>]+href="([^">]+)"

Andmete Töötlemine

  1. Logifailide Analüüs: Eemaldage teavet logikirjetest:

    • IP-aadressid: \b\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}\b
    • Aja templid: \d{4}-\d{2}-\d{2} \d{2}:\d{2}:\d{2}
    • Vigade sõnumid: ERROR: .*
  2. CSV Parsimine: Töötlege komaga eraldatud väärtusi koos võimalike tsiteeritud väljadega:

    • CSV väli matcher: (?:^|,)(?:"([^"]*(?:""[^"]*)*)"|([^,]*))

Teksti Töötlemine

  1. Leidmine ja Asendamine: Tuvastage mustrid asendamiseks:

    • Eemaldage HTML-märgid: <[^>]*>
    • Vormindage telefoninumbrid: (\d{3})(\d{3})(\d{4})($1) $2-$3
  2. Sisu Eemaldamine: Tõmmake spetsiifiline teave struktureerimata tekstist:

    • Eemaldage kuupäevad: \b(?:Jan|Feb|Mar|Apr|May|Jun|Jul|Aug|Sep|Oct|Nov|Dec)\s+\d{1,2},\s+\d{4}\b
    • Leidke rahalised väärtused: \$\d+(?:\.\d{2})?

Programmeerimine ja Koodimine

  1. Süntaksi Esiletõstmine: Tuvastage keele konstruktsioonid:

    • JavaScripti muutujad: \b(?:var|let|const)\s+([a-zA-Z_$][\w$]*)\b
    • Funktsiooni määratlemine: function\s+([a-zA-Z_$][\w$]*)\s*\(
  2. Koodi Refaktooring: Leidke mustrid, mis vajavad värskendamist:

    • Aegunud API kutsed: \.oldMethod\(
    • Turvamata funktsioonid: eval\(

Mustrite Salvestamine ja Haldamine

Meie regex muster tester sisaldab mustri haldamise süsteemi, mis võimaldab teil salvestada ja uuesti kasutada oma sageli kasutatavaid väljendeid:

Millal Salvestada Mustreid

Kaaluge mustrite salvestamist, mis:

  • Kasutate sageli erinevates projektides
  • On keerulised ja raske meeles pidada
  • Teenivad spetsiifilisi valideerimise eesmärke teie töös
  • Olete lihvinud pärast mitmeid iteratsioone

Parimad Praktikad Mustri Siltide Kohta

Mustreid salvestades kasutage kirjeldavaid silte, mis:

  • Näitavad mustri eesmärki (nt "E-posti Valideerija")
  • Mainivad spetsiifilisi vorminguid (nt "USA Telefoninumber")
  • Sisaldavad versiooni teavet, kui te iterite mustreid (nt "URL Valideerija v2")
  • On lühikesed, kuid informatiivsed

Mustri Organiseerimine

Organiseerige oma salvestatud mustrid järgmiselt:

  • Funktsioon (valideerimine, eraldamine, asendamine)
  • Domeen (veebiarendus, andmete töötlemine)
  • Keerukus (põhiline, täiustatud)
  • Kasutuse sagedus

Mustri Jagamine

Kuigi meie tööriist ei toeta otseselt mustrite jagamist kasutajate vahel, saate:

  • Kopeerida mustreid kolleegidega jagamiseks
  • Dokumenteerida oma mustreid jagatud hoidlas
  • Lisada mustri kirjeldusi projekti dokumentatsiooni

Tavaliste Regex Probleemide Lahendamine

Isegi kogenud arendajad puutuvad regulaarselt kokku regulaarväljenditega seotud väljakutsetega. Siin on lahendused tavalistele probleemidele:

Syntaksi Vead

Kui teie muster näitab valideerimisviga:

  • Kontrollige, kas sulud, ruudud või lokid on paaris
  • Veenduge, et erimärgid on õigesti tagurpidi
  • Kontrollige, et kvantifikaatoritel on eelnevad märgid või rühmad
  • Otsige kehtetut märgiklassi süntaksit

Tõhususe Probleemid

Kui teie regex on aeglane või põhjustab brauseri viivitusi:

  • Vältige liigset pesakonna kvantifikaatorite kasutamist (nt (a+)+)
  • Olge ettevaatlik järelevalve ja tagasivaatamise kasutamisel suurtes tekstides
  • Kaaluge spetsiifilisemate mustrite kasutamist laiaulatuslike asemel
  • Jagage keerulised mustrid väiksemateks, hallatavateks osadeks

Ootamatud Vastused

Kui teie muster vastab soovimatule tekstile:

  • Kasutage ankruid (^ ja $), et vastata täistekstele
  • Tehke märgiklassid täpsemaks
  • Lisage sõna piirid (\b) seal, kus see on asjakohane
  • Kasutage negatiivset järelevalvet, et välistada teatud mustrid

Ükski Vastus Ei Leitud

Kui teie muster ei vasta oodatud tekstile:

  • Kontrollige, kas on juhtumeid, mis on seotud suurtähtedega (kaaluge i lipu kasutamist)
  • Veenduge, et erimärgid on õigesti tagurpidi
  • Testige oma mustrit lihtsustatud näidetes esiteks
  • Veenduge, et kasutate õigeid märgiklasse

Alternatiivid Regulaarväljenditele

Kuigi regex on võimas, ei ole see alati parim lahendus iga tekstide töötlemise ülesande jaoks:

Stringi Meetodid

Lihtsate tekstitegevuste jaoks on kohalikud stringi meetodid sageli selgemad ja tõhusamad:

  • String.indexOf() alamsõnumite leidmiseks
  • String.startsWith() ja String.endsWith() stringi piiride kontrollimiseks
  • String.split() põhiliseks tokeniseerimiseks

Spetsialiseeritud Parsijad

Struktureeritud andmeformaatide jaoks on pühendatud parsijad usaldusväärsemad:

  • JSON parsijad JSON andmete jaoks
  • XML/HTML parsijad märgistuskeelte jaoks
  • CSV parsijad tabelarvutuste jaoks

Loomuliku Keelte Töötlemine (NLP)

Teksti tähenduse mõistmiseks, mitte ainult mustrite jaoks:

  • Tundeanalüüsi tööriistad
  • Nimeobjekti tuvastamine
  • Kõneosade märgistamine

Millal Valida Alternatiive

Kaaluge regex alternatiive, kui:

  • Tekstistruktuur on väga regulaarne ja lihtne
  • Vormingul on saadaval standardne parser
  • Peate mõistma semantilist tähendust
  • Tõhusus on väga suurte tekstide puhul kriitiline

Korduma Kippuvad Küsimused

Mis on regulaarne väljend?

Regulaarne väljend (regex) on märkide järjestus, mis määratleb otsingumustri. Neid mustreid saab kasutada stringi otsimiseks, vastamiseks ja tekstimanipulatsiooni operatsioonideks.

Miks mul on vaja regex muster testijat?

Regex muster tester aitab teil arendada ja tõrkeotsida regulaarväljendeid, pakkudes kohest visuaalset tagasisidet vastete, valideerides mustri süntaksit ja võimaldades teil katsetada erinevaid mustreid ja lippe, ilma et peaksite neid esmalt koodis rakendama.

Kuidas ma saan vastata sõnaselgele erimärgile nagu punkt või tärn?

Sõnaselgete erimärkide, millel on tavaliselt eriline tähendus regex-is, vastamiseks peate need tagurpidi kirjutama. Näiteks, et vastata sõnaselgele punktile, kasutage \. asemel lihtsalt ..

Mis vahe on .* ja .*? regex mustris?

.* on ahne kvantifikaator, mis vastab võimalikult paljudele märkidele, samas kui .*? on laisk (mitte-ahne) kvantifikaator, mis vastab võimalikult vähestele märkidele. See erinevus on oluline, kui soovite leida lühimat vastet, mitte pikimat.

Kas ma saan seda regex testijat kasutada mustrite jaoks mis tahes programmeerimiskeeles?

Kuigi põhiregex süntaks on sarnane paljudes keeltes, on teatud rakendustes peeneid erinevusi. Meie tester kasutab JavaScripti regex mootori, mis on ühilduv paljude veebikeeltega, kuid võib erineda regex-ist keeltes nagu Python, Java või Perl.

Kuidas ma saan valideerida kogu stringi regex-iga?

Kuna valideerida, et kogu string vastab mustrile, kasutage ^ ankru alguses ja $ ankru lõpus teie regex-is. Näiteks ^[0-9]+$ vastab ainult stringidele, mis koosnevad täielikult numbritest.

Mis on salvestavad rühmad ja kuidas ma neid kasutan?

Salvestavad rühmad, mis on loodud sulgudega (), võimaldavad teil eraldada spetsiifilisi osi vastatud tekstist. Meie testeris saate näha kõiki vastuseid, sealhulgas salvestatud rühmi. Programmeerimiskeeltes saate tavaliselt neid salvestusi juurde pääseda, indekseerides vastuse.

Kuidas ma saan oma regex mustreid tõhusamaks muuta?

Regex-i tõhususe parandamiseks: olge spetsiifilised märgiklasside osas, vältige tarbetute salvestavate rühmade kasutamist (kasutage mitte-salvestavaid rühmi (?:...), kui võimalik), piirake järelevalve/järelevalve kasutamist ja vältige katastroofilisi tagasivaatamismustreid nagu pesakonna kvantifikaatorid.

Millised on kõige levinumad regex vead, mida vältida?

Levinud vead hõlmavad: erimärkide mitte tagurpidi kirjutamist, liiga ahne mustri loomist, ankru mustrite unustamist (kasutades ^ ja $) ja liiga keeruliste väljendite kirjutamist, mida on raske hooldada.

Kas regex suudab käsitleda pesakondlikke struktuure nagu HTML?

Regulaarväljendid ei sobi pesakondlike struktuuride, näiteks HTML-i, analüüsimiseks. Kuigi saate luua regex mustreid lihtsate HTML-i vastete leidmiseks, on keerulise HTML-i töötlemise jaoks üldiselt parem kasutada pühendatud HTML parserit.

Viidatud Allikad

  1. Friedl, J. E. F. (2006). Mastering Regular Expressions. O'Reilly Media.
  2. Goyvaerts, J., & Levithan, S. (2012). Regular Expressions Cookbook. O'Reilly Media.
  3. "Regulaarne väljend." Wikipedia, Wikimedia Foundation, https://en.wikipedia.org/wiki/Regular_expression
  4. MDN Web Docs. "Regulaarväljendid." Mozilla, https://developer.mozilla.org/en-US/docs/Web/JavaScript/Guide/Regular_Expressions
  5. RegExr: Õpi, loo ja testi RegEx. https://regexr.com/

Proovige meie regex muster testijat täna, et lihtsustada oma tekstide töötlemise ülesandeid, valideerida sisendvorme ja eraldada tähenduslikku teavet struktureerimata tekstist. Olgu te algaja, kes õpib regulaarväljendite aluseid, või kogenud arendaja, kes töötab keeruliste mustriotsingute kallal, meie tööriist pakub teile vajalikke funktsioone, et luua, testida ja täiustada oma regex mustreid tõhusalt.

Tagasiside