forked from snguyenthanh/better_profanity
-
Notifications
You must be signed in to change notification settings - Fork 0
/
tests.py
157 lines (123 loc) · 7.62 KB
/
tests.py
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
# -*- coding: utf-8 -*-
import unittest
from better_profanity import profanity
class ProfanityTest(unittest.TestCase):
def setUp(self):
self.maxDiff = None
# Pre-load CENSOR_WORDSET
profanity.load_censor_words()
def test_contains_profanity(self):
profane = profanity.contains_profanity("he is a m0th3rf*cker")
self.assertTrue(profane)
def test_leaves_paragraphs_untouched(self):
innocent_text = """If you prick us do we not bleed?
If you tickle us do we not laugh?
If you poison us do we not die?
And if you wrong us shall we not revenge?"""
censored_text = profanity.censor(innocent_text)
self.assertEqual(innocent_text, censored_text)
def test_empty_string(self):
censored_text = profanity.censor("")
self.assertEqual(censored_text, "")
def test_censorship_1(self):
bad_text = "Dude, I hate shit. Fuck bullshit."
censored_text = profanity.censor(bad_text)
# make sure it finds both instances
self.assertFalse("shit" in censored_text)
# make sure it's case sensitive
self.assertFalse("fuck" in censored_text)
# make sure some of the original text is still there
self.assertTrue("Dude" in censored_text)
def test_censorship_2(self):
bad_text = "That wh0re gave m3 a very good H4nd j0b, dude. You gotta check."
censored_text = "That **** gave m3 a very good ****, dude. You gotta check."
self.assertEqual(profanity.censor(bad_text), censored_text)
def test_censorship_3(self):
bad_text = "Those 2 girls 1 cup. You gotta check. "
censored_text = "Those ****. You gotta check. "
self.assertEqual(profanity.censor(bad_text), censored_text)
def test_censorship_4(self):
bad_text = "2 girls 1 cup"
censored_text = "****"
self.assertEqual(profanity.censor(bad_text), censored_text)
def test_censorship_5(self):
bad_text = "fuck 2 girls 1 cup"
censored_text = "**** ****"
self.assertEqual(profanity.censor(bad_text), censored_text)
def test_censorship_with_starting_swear_word(self):
bad_text = " wh0re gave m3 a very good H@nD j0b."
censored_text = " **** gave m3 a very good ****."
self.assertEqual(profanity.censor(bad_text), censored_text)
def test_censorship_with_ending_swear_word(self):
bad_text = "That wh0re gave m3 a very good H@nD j0b."
censored_text = "That **** gave m3 a very good ****."
self.assertEqual(profanity.censor(bad_text), censored_text)
def test_censorship_empty_text(self):
empty_text = ""
self.assertEqual(profanity.censor(empty_text), empty_text)
def test_censorship_for_2_words(self):
bad_text = "That wh0re gave m3 a very good H4nd j0b"
censored_text = profanity.censor(bad_text)
self.assertFalse("H4nd j0b" in censored_text)
self.assertTrue("m3" in censored_text)
def test_censorship_for_clean_text(self):
clean_text = "Hi there"
self.assertEqual(profanity.censor(clean_text), clean_text)
def test_custom_wordlist(self):
custom_badwords = ["happy", "jolly", "merry"]
profanity.load_censor_words(custom_badwords)
# make sure it doesn't find real profanity anymore
self.assertFalse(profanity.contains_profanity("Fuck you!"))
# make sure it finds profanity in a sentence containing custom_badwords
self.assertTrue(profanity.contains_profanity("Have a merry day! :)"))
def test_censorship_without_spaces(self):
bad_text = "...pen1s...hello_cat_vagina,,,,qew"
censored_text = "...****...hello_cat_****,,,,qew"
self.assertEqual(profanity.censor(bad_text), censored_text)
class ProfanityUnicodeTestRussian(unittest.TestCase):
def setUp(self):
self.maxDiff = None
# Pre-load CENSOR_WORDSET
profanity.load_censor_words()
def test_unicode_censorship(self):
bad_text = "соседский мальчик сказал хайль и я опешил."
censored_text = "соседский мальчик сказал **** и я опешил."
profanity.load_censor_words(["хайль"])
self.assertEqual(profanity.censor(bad_text), censored_text)
def test_unicode_censorship_2(self):
bad_text = "Эффекти́вного противоя́дия от я́да фу́гу не существу́ет до сих пор"
censored_text = "Эффекти́вного **** от я́да фу́гу не существу́ет до сих пор"
profanity.load_censor_words(["противоя́дия"])
self.assertEqual(profanity.censor(bad_text), censored_text)
def test_unicode_censorship_3(self):
bad_text = "Эффекти́вного противоя́дия от я́да фу́гу не существу́ет до сих пор. Но э́то не остана́вливает люде́й от употребле́ния блюд из ры́бы фу́гу."
censored_text = "Эффекти́вного **** от я́да фу́гу не существу́ет до сих пор. Но э́то не остана́вливает люде́й от **** блюд из ры́бы фу́гу."
profanity.load_censor_words(["противоя́дия", "употребле́ния"])
self.assertEqual(profanity.censor(bad_text), censored_text)
def test_unicode_censorship_4(self):
bad_text = "...противоя́дия...hello_cat_употребле́ния,,,,qew"
censored_text = "...****...hello_cat_****,,,,qew"
profanity.load_censor_words(["противоя́дия", "употребле́ния"])
self.assertEqual(profanity.censor(bad_text), censored_text)
def test_unicode_censorship_5(self):
bad_text = "Маргаре́та (э́то бы́ло её настоя́щее и́мя) родила́сь в 1876 (ты́сяча восемьсо́т се́мьдесят шесто́м) году́ в Нидерла́ндах. В 18 (восемна́дцать) лет Маргаре́та вы́шла за́муж и перее́хала в Индоне́зию. Там она́ изуча́ла ме́стную культу́ру и та́нцы."
censored_text = "Маргаре́та (э́то бы́ло её настоя́щее и́мя) родила́сь в 1876 (ты́сяча восемьсо́т се́мьдесят ****) году́ в ****. В 18 (восемна́дцать) лет Маргаре́та вы́шла за́муж и **** в Индоне́зию. Там она́ изуча́ла ме́стную культу́ру и ****."
profanity.load_censor_words(["шесто́м", "Нидерла́ндах", "перее́хала", "та́нцы"])
self.assertEqual(profanity.censor(bad_text), censored_text)
class ProfanityUnicodeTestVietnamese(unittest.TestCase):
def setUp(self):
self.maxDiff = None
# Pre-load CENSOR_WORDSET
profanity.load_censor_words()
def test_unicode_vietnamese_1(self):
bad_text = "Đây là 1 câu nói bậy."
censored_text = "Đây là 1 **** nói ****."
profanity.load_censor_words(["câu", "bậy"])
self.assertEqual(profanity.censor(bad_text), censored_text)
def test_unicode_vietnamese_2(self):
bad_text = "Con chó sủa gâu gâu!"
censored_text = "Con chó sủa **** ****!"
profanity.load_censor_words(["gâu"])
self.assertEqual(profanity.censor(bad_text), censored_text)
if __name__ == "__main__":
unittest.main()