किसी भी पाठ में पात्रों के आवृत्ति वितरण का विश्लेषण और दृश्यता करें। अपने सामग्री को चिपकाएँ ताकि पात्रों की उपस्थिति पैटर्न दिखाने वाला एक इंटरएक्टिव बार चार्ट उत्पन्न किया जा सके।
पात्र आवृत्ति विश्लेषण एक मौलिक तकनीक है जो पाठ विश्लेषण में उपयोग की जाती है, जो एक दिए गए पाठ में प्रत्येक पात्र के कितनी बार प्रकट होने की गणना और दृश्यता को दर्शाती है। यह शक्तिशाली विधि भाषा के उपयोग में पैटर्न को प्रकट करती है, क्रिप्टानालिसिस, डेटा संकुचन, और भाषाई अध्ययन में मदद करती है। हमारा पात्र आवृत्ति विश्लेषण उपकरण किसी भी पाठ इनपुट का विश्लेषण करने और पात्र वितरण का स्पष्ट दृश्य प्रतिनिधित्व उत्पन्न करने का एक सरल लेकिन प्रभावी तरीका प्रदान करता है। पात्र आवृत्तियों को समझकर, आप पाठ संरचना में अंतर्दृष्टि प्राप्त कर सकते हैं, संभावित एन्कोडिंग मुद्दों की पहचान कर सकते हैं, या यहां तक कि ऐसे पैटर्न का पता लगा सकते हैं जो सामान्य पढ़ाई के माध्यम से तुरंत स्पष्ट नहीं होते।
यह उपकरण एक उपयोगकर्ता के अनुकूल इंटरफेस के साथ आता है जिसमें एक पाठ इनपुट क्षेत्र होता है जहां आप किसी भी सामग्री को पेस्ट या टाइप कर सकते हैं, और यह स्वचालित रूप से प्रत्येक पात्र की आवृत्ति को दर्शाने वाला एक बार चार्ट दृश्य उत्पन्न करता है। यह तात्कालिक दृश्य फीडबैक यह पहचानने में आसान बनाता है कि कौन से पात्र सबसे अधिक बार प्रकट होते हैं और आपके पाठ की समग्र संरचना को समझने में मदद करता है।
पात्र आवृत्ति विश्लेषण एक सरल सिद्धांत पर काम करता है: पाठ में प्रत्येक पात्र की प्रत्येक उपस्थिति की गणना करें और परिणामों को प्रदर्शित करें। जबकि यह अवधारणा सरल है, कार्यान्वयन में कई प्रमुख चरण शामिल हैं:
पात्र आवृत्ति का गणितीय प्रतिनिधित्व इस प्रकार व्यक्त किया जा सकता है:
जहां:
कार्यान्वयन आमतौर पर पात्रों की उपस्थिति की गणना के लिए एक हैश मैप (शब्दकोश) डेटा संरचना का उपयोग करता है:
11. एक खाली हैश मैप/शब्दकोश प्रारंभ करें
22. इनपुट पाठ में प्रत्येक पात्र के लिए:
3 क. यदि पात्र हैश मैप में है, तो उसकी गिनती बढ़ाएं
4 ख. यदि नहीं, तो उस पात्र को हैश मैप में 1 की गिनती के साथ जोड़ें
53. हैश मैप को पात्र-गिनती जोड़ों की एक सूची में परिवर्तित करें
64. आवश्यकतानुसार (वर्णानुक्रम में या आवृत्ति के अनुसार) सूची को क्रमबद्ध करें
75. क्रमबद्ध सूची के आधार पर दृश्यता उत्पन्न करें
8
यह दृष्टिकोण O(n) की समय जटिलता के साथ कार्य करता है, जहां n इनपुट पाठ की लंबाई है, जिससे यह बड़े पाठ नमूनों के लिए भी प्रभावी होता है।
हमारा पात्र आवृत्ति विश्लेषण उपकरण सहज और उपयोग में आसान होने के लिए डिज़ाइन किया गया है। अपने पाठ का विश्लेषण करने के लिए इन सरल चरणों का पालन करें:
इनपुट क्षेत्र में अपना पाठ दर्ज करने या पेस्ट करने से शुरू करें। उपकरण किसी भी पाठ सामग्री को स्वीकार करता है, जिसमें शामिल हैं:
आप जितना चाहें उतना पाठ दर्ज कर सकते हैं - एक वाक्य से लेकर पूरे दस्तावेज़ तक।
कई अन्य उपकरणों के विपरीत, हमारा पात्र आवृत्ति विश्लेषण उपकरण आपके पाठ को स्वचालित रूप से संसाधित करता है जब आप टाइप या पेस्ट करते हैं। अलग "गणना करें" बटन पर क्लिक करने की आवश्यकता नहीं है - परिणाम आपके इनपुट को संशोधित करते समय वास्तविक समय में अपडेट होते हैं।
जब आपका पाठ संसाधित हो जाता है, तो उपकरण प्रदर्शित करता है:
बार चार्ट यह पहचानने में आसान बनाता है:
यदि आपको अपने विश्लेषण परिणामों को सहेजने या साझा करने की आवश्यकता है:
यह सुविधा शोधकर्ताओं, छात्रों और पेशेवरों के लिए विशेष रूप से उपयोगी है जिन्हें अपने काम में आवृत्ति विश्लेषण शामिल करने की आवश्यकता होती है।
पात्र आवृत्ति विश्लेषण के विभिन्न क्षेत्रों में कई व्यावहारिक अनुप्रयोग हैं:
पात्र आवृत्ति विश्लेषण क्रिप्टानालिसिस में सबसे पुराने और सबसे मौलिक तकनीकों में से एक है। कई प्रतिस्थापन सिफरों में, मूल भाषा के आवृत्ति पैटर्न पहचानने योग्य रहते हैं, जिससे एन्क्रिप्टेड संदेशों को तोड़ने के लिए पात्र वितरण की तुलना करना संभव हो जाता है।
उदाहरण: अंग्रेजी पाठ में, 'E', 'T', 'A', और 'O' आमतौर पर सबसे अधिक प्रकट होते हैं। यदि एक एन्क्रिप्टेड पाठ में विभिन्न पात्रों के लिए उच्च आवृत्तियाँ दिखाई देती हैं, तो एक क्रिप्टानालिस्ट प्रतिस्थापन पैटर्न के बारे में शिक्षित अनुमान लगा सकता है।
कई संकुचन एल्गोरिदम अधिक कुशल एन्कोडिंग बनाने के लिए पात्र आवृत्ति की जानकारी पर निर्भर करते हैं। हफमैन कोडिंग, उदाहरण के लिए, अधिक प्रकट पात्रों को छोटे बिट अनुक्रम और कम सामान्य पात्रों को लंबे अनुक्रम असाइन करती है।
उदाहरण: एक पाठ में जहां 'E' 15% समय प्रकट होता है जबकि 'Z' केवल 0.07% प्रकट होता है, एक संकुचन एल्गोरिदम 'E' को 2-बिट कोड और 'Z' को 8-बिट कोड असाइन कर सकता है, जिससे महत्वपूर्ण स्थान की बचत होती है।
भाषाविज्ञानी पात्र आवृत्ति विश्लेषण का उपयोग भाषा पैटर्न का अध्ययन करने, लेखक की पहचान करने, और विभिन्न भाषाओं या बोलियों की तुलना करने के लिए करते हैं।
उदाहरण: एक लेखक के पास ऐसे विशिष्ट आवृत्ति पैटर्न हो सकते हैं जो उनके लेखन शैली का "फिंगरप्रिंट" के रूप में कार्य करते हैं। यह अज्ञात पाठों को असाइन करने या साहित्यिक चोरी का पता लगाने में मदद कर सकता है।
अपेक्षित आवृत्ति पैटर्न स्थापित करके, पात्र विश्लेषण डेटा के प्रेषित होने में संभावित त्रुटियों या भ्रष्टाचार की पहचान करने में मदद कर सकता है।
उदाहरण: यदि एक पाठ जो अंग्रेजी में होना चाहिए, मानक अंग्रेजी से काफी भिन्न आवृत्ति पैटर्न दिखाता है, तो यह प्रेषण त्रुटियों या एन्कोडिंग मुद्दों को इंगित कर सकता है।
NLP प्रणालियाँ अक्सर भाषा पहचान, भावना विश्लेषण, और अन्य पाठ प्रसंस्करण कार्यों में विशेषता के रूप में पात्र आवृत्ति का उपयोग करती हैं।
उदाहरण: विभिन्न भाषाओं में अलग-अलग पात्र आवृत्ति वितरण होते हैं। एक प्रणाली इस जानकारी का उपयोग यह स्वचालित रूप से पहचानने के लिए कर सकती है कि एक पाठ किस भाषा में लिखा गया है।
पात्र आवृत्ति विश्लेषण सांख्यिकी, भाषाविज्ञान, और प्रोग्रामिंग अवधारणाओं को सिखाने के लिए एक मूल्यवान शैक्षिक उपकरण हो सकता है।
उदाहरण: छात्र विभिन्न काल या लेखकों के पाठों का विश्लेषण कर सकते हैं ताकि यह देखा जा सके कि समय के साथ भाषा का उपयोग कैसे विकसित हुआ है।
हालांकि पात्र आवृत्ति विश्लेषण शक्तिशाली है, पाठ विश्लेषण के लिए वैकल्पिक दृष्टिकोण हैं जो आपकी विशिष्ट आवश्यकताओं के आधार पर अधिक उपयुक्त हो सकते हैं:
व्यक्तिगत पात्रों के बजाय, शब्द आवृत्ति विश्लेषण यह देखता है कि प्रत्येक शब्द पाठ में कितनी बार प्रकट होता है। यह अधिक अर्थपूर्ण जानकारी प्रदान करता है और सामग्री विश्लेषण, कीवर्ड पहचान, और विषय मॉडलिंग के लिए उपयोगी है।
कब उपयोग करें: जब आप पाठ के अर्थ और विषयों में अधिक रुचि रखते हैं, तो शब्द आवृत्ति विश्लेषण चुनें, न कि इसके पात्र-स्तरीय संरचना में।
एन-ग्राम विश्लेषण पात्रों या शब्दों के अनुक्रम (बिग्राम, ट्रिग्राम, आदि) को देखता है, न कि व्यक्तिगत तत्वों को। यह संदर्भ पैटर्न को कैप्चर करता है और भाषा मॉडलिंग और भविष्यवाणी पाठ प्रणालियों के लिए मूल्यवान है।
कब उपयोग करें: जब आपको अनुक्रमिक पैटर्न को समझने या भविष्यवाणी मॉडल बनाने की आवश्यकता हो, तो एन-ग्राम विश्लेषण को प्राथमिकता दें।
आवृत्तियों की गणना करने के बजाय, भावना विश्लेषण पाठ के भावनात्मक स्वर को निर्धारित करने का प्रयास करता है। यह प्राकृतिक भाषा प्रसंस्करण तकनीकों का उपयोग करके पाठ को सकारात्मक, नकारात्मक, या तटस्थ के रूप में वर्गीकृत करता है।
कब उपयोग करें: जब आप पाठ में व्यक्त भावनात्मक सामग्री या राय में रुचि रखते हैं, तो भावना विश्लेषण चुनें।
पठनीयता विश्लेषण यह मूल्यांकन करता है कि एक पाठ पढ़ने में कितना आसान या कठिन है, जैसे कि फ्लेश-किंकैड या SMOG इंडेक्स जैसे मेट्रिक्स का उपयोग करते हुए। ये कारक जैसे वाक्य की लंबाई और स्वरवर्ण की संख्या पर विचार करते हैं।
कब उपयोग करें: जब आपको किसी लक्षित दर्शक के लिए पाठ की जटिलता या पहुंच का आकलन करने की आवश्यकता हो, तो पठनीयता विश्लेषण सबसे अच्छा है।
पात्र आवृत्ति विश्लेषण का एक समृद्ध इतिहास है जो सदियों पीछे जाता है:
क्रिप्टोग्राफी के लिए आवृत्ति विश्लेषण के पहले ज्ञात अनुप्रयोगों में से एक 9वीं शताब्दी में अरब बहु-ज्ञानी अल-किंदी द्वारा था। अपने ग्रंथ "क्रिप्टोग्राफिक संदेशों को डिकोड करने पर," उन्होंने सरल प्रतिस्थापन सिफरों को तोड़ने के लिए पात्र आवृत्तियों का उपयोग करने का वर्णन किया।
यूरोपीय पुनर्जागरण के दौरान, क्रिप्टोग्राफर जैसे जोवन्नी बतिस्ता बेलासो और ब्लेज़ डे विजेनेरे ने अधिक जटिल सिफर विकसित किए जो विशेष रूप से आवृत्ति विश्लेषण का विरोध करने के लिए डिज़ाइन किए गए थे। इससे एन्क्रिप्शन और डिक्रिप्शन तकनीकों के बीच एक निरंतर लड़ाई हुई।
20वीं सदी में, पात्र आवृत्ति विश्लेषण युद्धकालीन क्रिप्टोग्राफी में एक महत्वपूर्ण भूमिका निभाई, विशेष रूप से द्वितीय विश्व युद्ध के दौरान जर्मन एनिग्मा कोड को तोड़ने में। बलेटचली पार्क में ब्रिटिश क्रिप्टानालिस्ट, जिनमें एलन ट्यूरिंग शामिल थे, ने अपने डिक्रिप्शन प्रयासों के हिस्से के रूप में आवृत्ति विश्लेषण का उपयोग किया।
कंप्यूटरों के आगमन के साथ, पात्र आवृत्ति विश्लेषण स्वचालित और अधिक जटिल हो गया। आधुनिक अनुप्रयोग क्रिप्टोग्राफी से कहीं आगे बढ़कर डेटा संकुचन, सूचना पुनर्प्राप्ति, और मशीन लर्निंग तक फैले हुए हैं।
आज, शोधकर्ता बड़े डेटा, साइबर सुरक्षा, और कृत्रिम बुद्धिमत्ता में अनुप्रयोगों के लिए आवृत्ति विश्लेषण तकनीकों को परिष्कृत करना जारी रखते हैं। मूलभूत सिद्धांत वही रहते हैं, लेकिन कार्यप्रणालियाँ और उपकरण नाटकीय रूप से विकसित हो गए हैं।
यहां विभिन्न प्रोग्रामिंग भाषाओं में पात्र आवृत्ति विश्लेषण के कार्यान्वयन हैं:
1def analyze_character_frequency(text):
2 # एक खाली शब्दकोश प्रारंभ करें
3 frequency = {}
4
5 # प्रत्येक पात्र की गणना करें
6 for char in text:
7 if char in frequency:
8 frequency[char] += 1
9 else:
10 frequency[char] = 1
11
12 # ट्यूपल की सूची में परिवर्तित करें और वर्णानुक्रम में क्रमबद्ध करें
13 result = sorted(frequency.items())
14
15 return result
16
17# उदाहरण उपयोग
18text = "Hello, World!"
19frequencies = analyze_character_frequency(text)
20for char, count in frequencies:
21 print(f"'{char}': {count}")
22
1function analyzeCharacterFrequency(text) {
2 // एक खाली वस्तु प्रारंभ करें
3 const frequency = {};
4
5 // प्रत्येक पात्र की गणना करें
6 for (let i = 0; i < text.length; i++) {
7 const char = text[i];
8 if (frequency[char]) {
9 frequency[char]++;
10 } else {
11 frequency[char] = 1;
12 }
13 }
14
15 // वस्तु को वस्तुओं की सूची में परिवर्तित करें और वर्णानुक्रम में क्रमबद्ध करें
16 const result = Object.entries(frequency)
17 .map(([char, count]) => ({ char, count }))
18 .sort((a, b) => a.char.localeCompare(b.char));
19
20 return result;
21}
22
23// उदाहरण उपयोग
24const text = "Hello, World!";
25const frequencies = analyzeCharacterFrequency(text);
26frequencies.forEach(item => {
27 console.log(`'${item.char}': ${item.count}`);
28});
29
1import java.util.*;
2
3public class CharacterFrequencyAnalyzer {
4 public static List<Map.Entry<Character, Integer>> analyzeCharacterFrequency(String text) {
5 // एक हैशमैप प्रारंभ करें
6 Map<Character, Integer> frequency = new HashMap<>();
7
8 // प्रत्येक पात्र की गणना करें
9 for (int i = 0; i < text.length(); i++) {
10 char c = text.charAt(i);
11 frequency.put(c, frequency.getOrDefault(c, 0) + 1);
12 }
13
14 // सूची में परिवर्तित करें और वर्णानुक्रम में क्रमबद्ध करें
15 List<Map.Entry<Character, Integer>> result = new ArrayList<>(frequency.entrySet());
16 result.sort(Map.Entry.comparingByKey());
17
18 return result;
19 }
20
21 public static void main(String[] args) {
22 String text = "Hello, World!";
23 List<Map.Entry<Character, Integer>> frequencies = analyzeCharacterFrequency(text);
24
25 for (Map.Entry<Character, Integer> entry : frequencies) {
26 System.out.println("'" + entry.getKey() + "': " + entry.getValue());
27 }
28 }
29}
30
1#include <iostream>
2#include <string>
3#include <map>
4#include <vector>
5#include <algorithm>
6
7std::vector<std::pair<char, int>> analyzeCharacterFrequency(const std::string& text) {
8 // एक मैप प्रारंभ करें
9 std::map<char, int> frequency;
10
11 // प्रत्येक पात्र की गणना करें
12 for (char c : text) {
13 frequency[c]++;
14 }
15
16 // जोड़ों की सूची में परिवर्तित करें
17 std::vector<std::pair<char, int>> result(frequency.begin(), frequency.end());
18
19 // मैप पहले से ही कुंजी (पात्र) द्वारा क्रमबद्ध है
20 return result;
21}
22
23int main() {
24 std::string text = "Hello, World!";
25 auto frequencies = analyzeCharacterFrequency(text);
26
27 for (const auto& pair : frequencies) {
28 std::cout << "'" << pair.first << "': " << pair.second << std::endl;
29 }
30
31 return 0;
32}
33
1def analyze_character_frequency(text)
2 # एक खाली हैश प्रारंभ करें
3 frequency = Hash.new(0)
4
5 # प्रत्येक पात्र की गणना करें
6 text.each_char do |char|
7 frequency[char] += 1
8 end
9
10 # जोड़ों की सूची में परिवर्तित करें और वर्णानुक्रम में क्रमबद्ध करें
11 result = frequency.to_a.sort_by { |char, _| char }
12
13 return result
14end
15
16# उदाहरण उपयोग
17text = "Hello, World!"
18frequencies = analyze_character_frequency(text)
19frequencies.each do |char, count|
20 puts "'#{char}': #{count}"
21end
22
पात्र आवृत्ति विश्लेषण एक तकनीक है जो यह गणना करती है कि प्रत्येक पात्र एक पाठ में कितनी बार प्रकट होता है। यह पात्रों के वितरण और पैटर्न के बारे में अंतर्दृष्टि प्रदान करता है, जो क्रिप्टोग्राफी, डेटा संकुचन, भाषाई अध्ययन, और अन्य पाठ विश्लेषण अनुप्रयोगों के लिए उपयोगी हो सकता है।
पात्र आवृत्ति विश्लेषण की सटीकता नमूने के आकार पर निर्भर करती है। छोटे पाठों के लिए, आवृत्ति वितरण सामान्यतः भाषा के पैटर्न से मेल नहीं खा सकता है। हालांकि, बड़े पाठों (कई पैराग्राफ या अधिक) के लिए, विश्लेषण आमतौर पर पात्र वितरण का एक विश्वसनीय प्रतिनिधित्व प्रदान करता है।
नहीं, पात्र आवृत्ति विश्लेषण अकेले आधुनिक एन्क्रिप्शन एल्गोरिदम जैसे AES या RSA को नहीं तोड़ सकता है। यह मुख्यतः सरल प्रतिस्थापन सिफरों और कुछ शास्त्रीय एन्क्रिप्शन विधियों के खिलाफ प्रभावी है। आधुनिक क्रिप्टोग्राफी जटिल गणितीय संचालन और कुंजी-आधारित प्रणालियों का उपयोग करती है जो आवृत्ति पैटर्न को संरक्षित नहीं करती हैं।
प्रत्येक भाषा का एक विशिष्ट पात्र आवृत्ति प्रोफ़ाइल होता है। उदाहरण के लिए, अंग्रेजी में, 'E' आमतौर पर सबसे सामान्य अक्षर होता है, जबकि स्पेनिश में, 'E' और 'A' सबसे अधिक प्रकट होते हैं। जर्मन में 'E', 'N', और 'I' की अधिक उपस्थिति होती है, और इसमें ऐसे पात्र होते हैं जैसे 'ß' और उमा्लट जो अंग्रेजी में नहीं होते।
पात्र आवृत्ति विश्लेषण व्यक्तिगत पात्रों (अक्षर, संख्याएँ, विराम चिह्न) की गणना करता है, जबकि शब्द आवृत्ति विश्लेषण पूर्ण शब्दों की गणना करता है। पात्र विश्लेषण अधिक मौलिक है और सभी पाठ प्रकारों में कार्य करता है, जबकि शब्द विश्लेषण अधिक अर्थपूर्ण जानकारी प्रदान करता है लेकिन इसके लिए भाषा-विशिष्ट प्रसंस्करण की आवश्यकता होती है।
पात्र आवृत्ति की जानकारी एंट्रॉपी-आधारित संकुचन एल्गोरिदम जैसे हफमैन कोडिंग के लिए आवश्यक है। अधिक प्रकट पात्रों को छोटे कोड और कम सामान्य पात्रों को लंबे कोड असाइन करके, ये एल्गोरिदम फ़ाइल के आकार को महत्वपूर्ण रूप से कम कर सकते हैं जबकि सभी जानकारी को संरक्षित रखते हैं।
यह आपकी विशिष्ट अनुप्रयोग पर निर्भर करता है। क्रिप्टानालिसिस और भाषाई अध्ययन के लिए, आमतौर पर बड़े और छोटे अक्षरों को अलग पात्रों के रूप में मानना उपयोगी होता है। अन्य अनुप्रयोगों के लिए, विश्लेषण से पहले सभी पाठ को छोटे अक्षरों में परिवर्तित करना अधिक अर्थपूर्ण परिणाम प्रदान कर सकता है, जो अक्षरों पर ध्यान केंद्रित करता है न कि उनके केस पर।
हालांकि पात्र आवृत्ति अकेले लेखक की पहचान करने के लिए आमतौर पर पर्याप्त नहीं है, यह एक बड़े स्टाइलोमेट्रिक विश्लेषण में एक विशेषता हो सकता है। जब इसे शब्द चयन, वाक्य की लंबाई, और अन्य भाषाई मार्करों के साथ जोड़ा जाता है, तो पात्र आवृत्तियाँ लेखक की पहचान या सत्यापन में योगदान कर सकती हैं।
हमारा पात्र आवृत्ति विश्लेषण उपकरण सभी पात्रों, जिसमें स्पेस, विराम चिह्न, और विशेष पात्र शामिल हैं, की गणना करता है। प्रत्येक अद्वितीय पात्र को आवृत्ति गणना में एक अलग इकाई के रूप में माना जाता है, जो पाठ की संरचना का एक पूर्ण चित्र प्रदान करता है।
यह उपकरण विभिन्न लंबाई के पाठों को संभालने के लिए डिज़ाइन किया गया है, छोटे वाक्यों से लेकर लंबे दस्तावेज़ों तक। हालांकि, बहुत बड़े पाठ (सैकड़ों हजारों पात्र) ब्राउज़र में कुछ प्रदर्शन धीमा कर सकते हैं। अत्यधिक बड़े डेटा सेट के लिए, एक समर्पित डेस्कटॉप एप्लिकेशन या प्रोग्रामिंग लाइब्रेरी का उपयोग करने पर विचार करें।
सिंह, एस. (1999). कोड पुस्तक: प्राचीन मिस्र से क्वांटम क्रिप्टोग्राफी तक गुप्तता का विज्ञान. एंकर पुस्तकें।
शैनन, सी. ई. (1951). "प्रिंटेड इंग्लिश की भविष्यवाणी और एंट्रॉपी।" द बेल सिस्टम टेक्निकल जर्नल, 30(1), 50-64।
बेकर, एच., & पाइपर, एफ. (1982). सिफर सिस्टम: संचार की सुरक्षा। नॉर्थवुड पुस्तकें।
अल-कज़ाज़, एन. आर., टेहान, डब्ल्यू. जे., & इर्विन, एस. ए. (2018). "सरल प्रतिस्थापन सिफरों का स्वचालित क्रिप्टानालिसिस संकुचन का उपयोग करके।" सूचना विज्ञान, 474, 18-28।
हफमैन, डी. ए. (1952). "न्यूनतम-प्रतिनिधित्व कोड के निर्माण के लिए एक विधि।" IRE की कार्यवाही, 40(9), 1098-1101।
कॉनहाइम, ए. जी. (2010). कंप्यूटर सुरक्षा और क्रिप्टोग्राफी. जॉन विले और बेटे।
जूला, पी. (2006). "लेखक की पहचान।" सूचना पुनर्प्राप्ति में आधार और रुझान, 1(3), 233-334।
स्टालिंग्स, डब्ल्यू. (2017). क्रिप्टोग्राफी और नेटवर्क सुरक्षा: सिद्धांत और अभ्यास (7वीं संस्करण)। पियर्सन।
हमारे पात्र आवृत्ति विश्लेषण उपकरण के साथ किसी भी पाठ का विश्लेषण करें ताकि पैटर्न खोजें, संकुचन का अनुकूलन करें, या बस अपने सामग्री की संरचना का अन्वेषण करें। विभिन्न नमूनों का प्रयास करें ताकि यह देखा जा सके कि पात्र वितरण विभिन्न भाषाओं, लेखकों, और पाठ प्रकारों के बीच कैसे भिन्न होता है!
अपने वर्कफ़्लो के लिए उपयोगी हो सकने वाले और अधिक उपकरण खोजें।