在最近一兩周,我做了一件事情,挖掘了全網(wǎng)30幾萬條數(shù)據(jù),提取出了200多個(gè)大小項(xiàng)目名稱,通過各種維度分門別類做成一個(gè)項(xiàng)目庫。
互聯(lián)網(wǎng)出現(xiàn)過的大部分項(xiàng)目形式,都能在這份數(shù)據(jù)里見到,具體的提取步驟讓我們先來看個(gè)小項(xiàng)目!
一個(gè)小項(xiàng)目
這是一個(gè)“喊話祝?!钡捻?xiàng)目,就是可以定制一些指定的祝福話,然后讓非洲黑人哥們喊出來,所以這個(gè)業(yè)務(wù)又經(jīng)常叫“海外舉牌”、“國際祝福”。
除了黑人哥們,還有烏克蘭小姐姐、泰國人Y之類的,各種類型應(yīng)有盡有:
這樣一個(gè)項(xiàng)目能賺錢嘛?在萬能的某寶里:
排名第一頁的商家基本在幾百幾千銷量不等(或多或少刷了點(diǎn)吧),至于單價(jià)沒辦法確定,因?yàn)椋?/p>
由于是定制的,價(jià)格需要溝通,另外也看到:
價(jià)格最高可以到幾百元不等!
某寶的競爭看起來蠻激烈的,咸魚也差不多,拉下好幾屏都是相關(guān)賣家:
公眾號這個(gè)渠道顯然也不會被業(yè)內(nèi)人員忘記:
對大部分商業(yè)模式的驗(yàn)證,百度競價(jià)都是非常直接的:
首頁有三個(gè)廣告位!
做投放的朋友都明白,在投的信息流廣告,不一定賺錢,但相對來說,在投的競價(jià)廣告,大概率是賺錢的,競價(jià)本身就是非常直接的 精準(zhǔn)流量買賣。
至于短視頻:
這個(gè)業(yè)務(wù)的模式就好像“老照片修復(fù)”那樣,天然的適合短視頻推廣,我甚至都看到了同一個(gè)人(微信號)在抖音、公眾號等渠道一起做。
以我個(gè)人的經(jīng)驗(yàn),這個(gè)項(xiàng)目集合了一個(gè)“優(yōu)質(zhì)互聯(lián)網(wǎng)項(xiàng)目”的許多特質(zhì):
非標(biāo):不是什么標(biāo)準(zhǔn)產(chǎn)品,大眾沒有價(jià)格概念。
服務(wù)型:沒有實(shí)體貨物、不存在進(jìn)貨壓貨。
可復(fù)購:今天送A朋友,感覺不錯明天就可以送B朋友,就是玩!
輕運(yùn)營:不需要場地和大量人工。
好交付:大家圖個(gè)開心,這只是一場“娛樂性質(zhì)”的交易,不存在肥的瘦的挑挑揀揀。
這個(gè)業(yè)務(wù)是絕對賺錢的,各大互聯(lián)網(wǎng)主流平臺都有人在“瘋狂”推廣,真實(shí)利潤超過想象。
如何看到各種項(xiàng)目
其實(shí)這個(gè)項(xiàng)目我早前也知道,感覺挺有意思但沒深入,后來也看到朋友圈有些朋友在經(jīng)營,客戶購買的需求大多是給朋友生日、開業(yè)送個(gè)意外驚喜、裝13等(人性很重要)。
ps:幾百塊花錢買開心的人大有所在,在我們以前的項(xiàng)目里,曾經(jīng)有位40+的大哥在我們這一天付款3次 花了近2000塊來買我們的服務(wù),他真的就只是為了面子,我們含淚賺了1200左右……
喊話祝福這樣一個(gè)項(xiàng)目我相信依然還有很多人沒有聽過,而這一次之所以提到它,是因?yàn)樵谖医谧鲰?xiàng)目庫時(shí),又一次看到了它。
項(xiàng)目背后是如何運(yùn)作的,上下游我也還不是很了解,項(xiàng)目運(yùn)營起來肯定也有需要克服的困難,但這些不是本文要討論的,關(guān)鍵在于:
“喊話祝?!?這是這個(gè)項(xiàng)目的名稱或者說業(yè)務(wù)描述,所謂的項(xiàng)目名稱或業(yè)務(wù)描述:
頭條號擼收益、外賣cps、全自動掛機(jī)、淘寶客發(fā)單 ……
這些就是特定項(xiàng)目的特定描述,一般從字面可以直接明白這個(gè)項(xiàng)目在做什么。
而“喊話祝?!边@四個(gè)字我們不太可能會在某天靈光一閃就出現(xiàn)在腦海里,因?yàn)樗侨藶閯?chuàng)造的,沒有標(biāo)準(zhǔn)或規(guī)則。
如果我們知道這四個(gè)字,或者說我們知道了某個(gè)項(xiàng)目的具體描述,經(jīng)過簡單的搜索很容易了解到這個(gè)業(yè)務(wù)。
而當(dāng)它是一個(gè)藍(lán)海、商機(jī)、或者適合我們自身情況的業(yè)務(wù),那這四個(gè)字就是極具高價(jià)值的信息差。
問題是:怎么憑空挖掘?怎么大批量挖掘?
說起來好像很難,其實(shí)也沒有那么難,下面用幾個(gè)小策略就可以搞定。
步驟一:
簡單收集一批跟“賺錢”、“項(xiàng)目”、“副業(yè)”、“兼職”等有關(guān)的長尾詞:
把這些長尾詞拿到百度里搜索,把自然排名在前面的網(wǎng)站收集到表格里:
這樣我們就得到了很多專門發(fā)布互聯(lián)網(wǎng)賺錢項(xiàng)目文章的網(wǎng)站、博客、論壇。
這個(gè)收集邏輯如果使用技術(shù)的話,可以參考這篇文章:零粉絲,運(yùn)用錯位競爭,運(yùn)營「好物推薦」
步驟二:
挨個(gè)訪問這些網(wǎng)站,整理這些網(wǎng)站的所有欄目分頁鏈接(列表頁):
包括分頁的首尾頁碼,一起整合到文檔:
用技術(shù)或Excel批量生成出所有分頁鏈接,比如某個(gè)分頁:
在本次的采集中,我總共收集了30幾個(gè)站點(diǎn),所有列表生成出23000多個(gè)分頁鏈接,具體鏈接就不展示了。
接下來自己寫爬蟲或用“火車頭”、“八爪魚”之類的爬蟲工具采集每個(gè)分頁里的文章標(biāo)題,如果有簡介(文章簡介)也一起采集進(jìn)來。
在本次的采集中,我總共獲取到20幾萬條標(biāo)題,10幾萬條簡介:
ps:數(shù)據(jù)源不只是網(wǎng)站,知乎、公眾號、社群等都可以。
步驟三:
這些文章標(biāo)題都在談?wù)摳鞣N項(xiàng)目業(yè)務(wù),那么很顯然我們需要把里面存在的項(xiàng)目名稱或業(yè)務(wù)描述提取出來,這里有著大量有價(jià)值的信息。
可問題在于:我們并不知道各種未知的項(xiàng)目名稱或業(yè)務(wù)描述具體是什么。
1:統(tǒng)計(jì)所有詞根
使用python的jieba分詞,可以把這30幾萬數(shù)據(jù)里出現(xiàn)的詞匯都分割出來,加上疊加計(jì)算就可以得到這樣一份數(shù)據(jù):
先保留著它!
2:無差別分割文本
“如何用公眾號做喊話祝福項(xiàng)目”
類似這樣一個(gè)標(biāo)題,如果使用傳統(tǒng)的分詞方式比如jieba分詞,則會把“喊話祝福”分割成“喊話”、“祝?!?。
因?yàn)椤昂霸挕薄ⅰ白8!笔俏覀兂R娫~匯,但“喊話祝?!辈⒉皇?,除非我們事先告訴程序“喊話祝?!笔且粋€(gè)詞,可我們現(xiàn)在正是不知道30幾萬的數(shù)據(jù)里都會是些什么樣的詞,知道了那也就不需要再提取了。
考慮到所謂的詞匯(長尾詞)是:
字與字之間相鄰而成詞,一個(gè)詞最少有兩個(gè)字組成,最長不一定,一般表述一個(gè)業(yè)務(wù)的詞匯在4-7個(gè)字就足夠了,假設(shè)限定在7個(gè)字。
因?yàn)槲覀儾恢罉颖緮?shù)據(jù)里有存在什么詞匯,那么我們要做的就是把標(biāo)題里所有可能組合成詞的文本都羅列出來:
這是一個(gè)無差別分割的步驟,所有相鄰的兩個(gè)字、所有相鄰的三個(gè)字、以此類推到7個(gè)字,可以看到“喊話祝?!边@個(gè)文本就被切割出來了。
如果設(shè)定詞長4-7,把30幾萬樣本數(shù)據(jù)里的每一條數(shù)據(jù)做無差別分割,把所有可能形成詞的文本全部組合排列出來,總共得到了2000多萬個(gè)可能的詞……
考慮到4個(gè)字或5個(gè)字的詞匯其實(shí)有很多是沒辦法表達(dá)或描述一個(gè)業(yè)務(wù)的,比如統(tǒng)計(jì)下來,這些詞匯有很多是:百度貼吧、阿里巴巴、微信朋友圈、淘寶店鋪 這樣的詞匯(因?yàn)闃颖緮?shù)據(jù)都是互聯(lián)網(wǎng)相關(guān)文章)。
2個(gè)字或者3個(gè)字的就更沒有意義了,畢竟出來一大堆的:百度、淘寶、怎么、應(yīng)該,這樣的詞匯。
因此把最小詞長度上調(diào)到6,即只計(jì)算6個(gè)字和7個(gè)字的片段,就這樣的情況也有足足1千1百多萬個(gè)。
當(dāng)然:如果“挖礦”這個(gè)詞代表著一個(gè)全新的未知的優(yōu)質(zhì)項(xiàng)目,那很可能我們就錯過了,好在這樣的情況是相對少數(shù)的,而且“挖礦”一定還會和其它詞綴組合成各種更長的描述。
3:去除無效詞匯
使用無差別分割的方式會導(dǎo)致:“如何用公眾號做喊話祝福項(xiàng)目” 這樣一個(gè)標(biāo)題里必然會分割出:“何用公眾號做喊” 這樣的詞匯。
我們很明白這是無效詞匯,而這種無差別的分割還會大比例的產(chǎn)生非常多這種詞匯:
接下來我們在上面做的全局詞根統(tǒng)計(jì)就體現(xiàn)價(jià)值了:
當(dāng)我們從“如何用公眾號做喊話祝福項(xiàng)目” 這樣一個(gè)標(biāo)題里發(fā)現(xiàn):“何用公眾號做喊” 這樣的詞匯時(shí),我們可以讓程序提取下“何用公眾號做喊”的第一個(gè)字,得到:“何”,再提取下“何用公眾號做喊”這段文本在原標(biāo)題的前一個(gè)字,自然會得到:“如”。
把得到的“如”+“何”=“如何”拿到之前統(tǒng)計(jì)的詞根庫里查找,如果找得到“如何”(之前的詞根庫里都是正確的詞匯),說明“何用公眾號做喊”這段文本不算詞匯,它只是一個(gè)缺失了的不完整文本,丟棄!
同理:做完了頭,尾也是一樣的操作,我們會發(fā)現(xiàn)“喊”后面的“話”缺失了,同樣丟棄,不管是頭還是尾,只要有一邊缺失,這就不是個(gè)正常的詞匯,直接丟棄。
當(dāng)一段文本的頭尾詞匯都是完整的,起碼這個(gè)詞匯不是無效的。
做完這步操作后,目標(biāo)文本從1千萬的數(shù)量瞬間減少到只剩230萬的級別,現(xiàn)在看起來干凈多了:
當(dāng)然,仍然存在問題……
4:去除無意義詞匯
在過程中還會有這樣的詞匯:“抖音直播應(yīng)該”,這樣的詞匯我們在上一步是處理不掉的,因?yàn)樗鼉蛇叾紱]有缺失。
但實(shí)際上這樣的詞匯它的表述本身就不完整,沒有意義。
其次我們按常識思考一下:
頭條號擼收益、外賣cps、全自動掛機(jī)、淘寶客發(fā)單、喊話祝福 ……
像這種正常在表達(dá)或描述一個(gè)業(yè)務(wù)的詞匯,會不會出現(xiàn):這個(gè)、那個(gè)、可能、肯定、會不會、能不能 等等這種字眼呢?
答案是基本不可能!
所以接下來我們簡單粗暴一點(diǎn):
收集一份這樣的詞匯(這個(gè)我一直有一份),對于目標(biāo)文本,只要有包含這里面的任何一個(gè)詞根,直接丟棄。
做完這一步,剩下的更加清爽了,只剩下30幾萬條詞匯:
直接只剩下不到10分1其實(shí)也可以理解,因?yàn)樵谌魏握Z境中:這個(gè)、那個(gè)、可能、肯定、會不會、能不能 等等這種連詞、介詞之類的,都是大量出現(xiàn)的,不管寫任何領(lǐng)域的內(nèi)容都離不開它們。
ps:過往經(jīng)驗(yàn)和結(jié)果都告訴我,看似簡單粗暴的策略,往往效果很明顯。
步驟4:
接下來就簡單了,有條件的,直接把這幾十萬詞匯拿去做自動歸類(不需要絕對的類似,有些類似即可,比如余弦值在0.5左右),那些死活處理不掉的:
它們自然會被歸到一片去,因?yàn)樗鼈儾皇鞘裁?strong>特定描述,而是生活中經(jīng)常會出現(xiàn)的表達(dá),自然會有很多類似的詞匯,這些在Excel里我們可以很輕松的掃過,無須留意。
相比之下:喊話祝福、外賣cps,這種特定描述它沒有那么多類似詞匯,很多業(yè)務(wù)的特定描述只出現(xiàn)一兩次,歸類完之后它們就只能墊底了:
喊話祝福在30幾萬樣本數(shù)據(jù)里也就只被人提到三五次,所以從下往上人工看,能很快的把一個(gè)個(gè)撿出來。
千萬級的數(shù)據(jù)被我們篩選到只剩下一二十萬詞,剩下的就需要人工介入,機(jī)器不可能一步到位,我們能做的就是盡可能的減少工作量。
當(dāng)然,如果你不能歸類,也可以用另一種方式來提取可能的項(xiàng)目:
直接篩選目標(biāo)詞匯,就可以看到與它相關(guān)的所有可能的項(xiàng)目,記錄下你感興趣的、不明白的。
這些目標(biāo)詞匯可以是各大主流平臺,比如:抖音、百度
ps:梳理主流平臺可能涉及的業(yè)務(wù),我也有梳理過,過程中你就會發(fā)現(xiàn)比如百度:它的各種相關(guān)產(chǎn)品都是被人用來引流的,比如微信:基于它或它的子產(chǎn)品延伸出來的項(xiàng)目是最多的。
除此之外,我們還可以輸入生活中的一些具體事物,要知道很多項(xiàng)目都是圍繞這些事物的,比如:圖片、視頻、課程:
這種篩選方式人工會相對累點(diǎn)。
最后:懂程序的朋友其實(shí)捋一下思路會發(fā)現(xiàn),以上實(shí)現(xiàn)下來在技術(shù)上極其簡單,沒有什么算法或公式,也沒有復(fù)雜的代碼邏輯。
更關(guān)鍵的還是在于對場景問題的思考,所以以上步驟并不是唯一,需要結(jié)合場景來調(diào)整,不要按部就班,關(guān)鍵在于理解每一步的意義。
整理
梳理了下主流平臺可能涉及的業(yè)務(wù),把其中形式或性質(zhì)類似的整合在一起,可以得到類似這樣一份框架:
這份數(shù)據(jù)我自己測試了下,市面上主流的平臺延伸出來的相關(guān)業(yè)務(wù)、項(xiàng)目,都在這里找到或類似的,完全可以按圖索驥。
維度并不是唯一,我們還可以輸入一些節(jié)日,得到相關(guān)的業(yè)務(wù):
但是本身相對較少,也就看到一個(gè)我們熟悉的七夕蛤蟆,當(dāng)然還有其他節(jié)日。
除了各大平臺延伸的項(xiàng)目以外,我們還會看到各種“亂七八糟的小項(xiàng)目”:
挑選了一些給大家看一下,在文章底部我收集了一批。
很多時(shí)候能讓我們找到機(jī)會的,往往是這些小項(xiàng)目,為什么我經(jīng)常會拿一些小項(xiàng)目舉例呢?
因?yàn)楹芏喑墒旆€(wěn)定的小項(xiàng)目一般都滿足mvp模型(最小可行性產(chǎn)品)!
小項(xiàng)目適合以小見大,麻雀雖小,五臟俱全,一個(gè)最小可行性產(chǎn)品包括了運(yùn)營一個(gè)項(xiàng)目的所有必須環(huán)節(jié),如果自己不能成功跑通這樣一個(gè)小項(xiàng)目,那就更別提各種大項(xiàng)目了。
這些小項(xiàng)目對我們的主要意義就在于開拓思維,了解項(xiàng)目的模式或背后針對的人性問題。
變聲器
這三個(gè)字,是你理解的那三個(gè)字,但是這個(gè)工具它背后對標(biāo)的打法和群體卻不是你想象的。
在線要飯
人生全靠想象力(只是順帶聊到,嚴(yán)重不推薦……)。
插花教程
文藝類的東西我也不懂,所以不研究,但是這都2021年了,光盤教程(硬盤U盤)仍然還存在著,競價(jià)戶也是套的。
這文案看完就很感動嘛……
這東西跟燒烤、小吃教程、配方之類的是一樣的,在閑魚的價(jià)格能讓人哭出來,怎么還會有人到百度搜索買呢?
然而很多行業(yè),人家選擇做競價(jià)推廣,一定是有原因的:
同樣的業(yè)務(wù),360也同時(shí)在投放!
數(shù)據(jù)來源于網(wǎng)絡(luò),我們使用這樣的方式當(dāng)然避不可免的會看到很多H|H產(chǎn)業(yè)務(wù),違法的業(yè)務(wù)我都不看,所以很多H產(chǎn)也就不展示了,雖然這些內(nèi)容還挺開眼界。
要知道賺錢有三個(gè)階段:能賺、賺多、賺久,違法的東西明顯很滿足前兩者,后者就完全不可能了,不值得。
除了我們表面可以看到的項(xiàng)目以外,其實(shí)這些數(shù)據(jù)里還隱藏著表面看不到的項(xiàng)目,那就是各種疑問詞:
這些都是行業(yè)里的人涉及到的麻煩問題,也是因?yàn)槭莻€(gè)問題,所以寫出文章來探討,如果有合適的技術(shù),提供鏟子也是一種項(xiàng)目。
ps:如果要提取疑問詞,在前面“去除無意義詞匯”的步驟里不要加入疑問詞根!
當(dāng)然了,互聯(lián)網(wǎng)經(jīng)久不衰的話題--引流:
這樣一份數(shù)據(jù)只需要經(jīng)過幾個(gè)小時(shí)的梳理和整理就可以統(tǒng)計(jì)出目前互聯(lián)網(wǎng)主流的“引流平臺”和“引流方式”以及常見的“引流對象”,把這些全部放到眼前,引流這份工作就只剩下執(zhí)行力了。
這份數(shù)據(jù)的引流信息我還沒有梳理,不過其實(shí)這些年也沒有太多變化,平臺還是那些平臺,方式還是那些方式,目標(biāo)對象還是那些群體,只是有根據(jù)一些場景做變動。
后續(xù)如果有整理我再發(fā)公眾號!
有些詞匯不一定是具體的什么項(xiàng)目,但是它們涉及到了很多行業(yè)問題,這些黑話、術(shù)語也有參考價(jià)值(這些內(nèi)容就不發(fā)了)。
最后,如果想要專門寫些項(xiàng)目分享、討論的文章,這樣一份數(shù)據(jù)相當(dāng)于地圖一般,永遠(yuǎn)都可以在這里找到很多可以寫的事物。
這樣一份互聯(lián)網(wǎng)項(xiàng)目庫,通過任何既有的搜索工具都是沒辦法批量檢索出來的。
延伸
在這個(gè)例子里,我們的樣本數(shù)據(jù)是標(biāo)題,然而標(biāo)題有時(shí)具有一定的局限性,它的語境、語料都不是非常豐富,有些文章也不一定都在標(biāo)題里寫明要討論的項(xiàng)目。
因此,最合適作為樣本數(shù)據(jù)的,仍然是文章,文章才是最豐富的語料庫,諸如知乎上這樣的問題:
多搜集幾個(gè)類似問題,把每一個(gè)的答案都作為樣本數(shù)據(jù),相信可以提取出來很多有價(jià)值的信息。
結(jié)尾
上面提到的項(xiàng)目庫,我把提取出來的項(xiàng)目名稱做了下歸類,把同樣形式或性質(zhì)的匯總起來,最后梳理在一張表格圖里。
對于沒有接觸過太多項(xiàng)目的朋友,這樣一份匯總數(shù)據(jù)可以讓自己對互聯(lián)網(wǎng)主流項(xiàng)目有個(gè)清晰的概念。
另外附帶100個(gè)奇奇怪怪的小項(xiàng)目,有些我也是剛看到,有些大家很熟悉,有些我認(rèn)為有代表性和啟發(fā)價(jià)值,但是大部分都還是有人在經(jīng)營著。
提醒:
有些朋友可能會覺得:自己也經(jīng)常看網(wǎng)賺文章,里面的項(xiàng)目也不是看了就能做,其實(shí)這么來看,出發(fā)點(diǎn)就是錯誤的。
這份數(shù)據(jù)我自己也在梳理和分析,但是挖掘項(xiàng)目,它不是說我打開數(shù)據(jù)一看,遠(yuǎn)遠(yuǎn)望去有個(gè)閃閃發(fā)光的東西,我目光掃去發(fā)現(xiàn)居然是一個(gè)暴利項(xiàng)目,然后從此發(fā)家致富……
這是小說體!
我們有可能運(yùn)氣爆棚的找到一兩個(gè)可以立馬上手、短時(shí)間內(nèi)帶來可觀收益的業(yè)務(wù),但這只是你運(yùn)氣好,可你并不能去對這種運(yùn)氣太期待。
梳理一份項(xiàng)目庫的意義在于幫自己構(gòu)造一個(gè)知識脈絡(luò),當(dāng)一大片互聯(lián)網(wǎng)常見的業(yè)務(wù)模式擺在你眼前時(shí),你能快速的形成一個(gè)知識網(wǎng)絡(luò)。
接著把其中那些你不了解不明白的項(xiàng)目、信息拿出來重點(diǎn)了解,你又能得到一大堆新鮮的見識,你會發(fā)現(xiàn)原來人家在做這些、原來人家是這么玩的。
這些知識在腦海里重構(gòu)之后,一些平時(shí)你沒感覺的信息又會有新的理解,判斷力和知識面由此提升。
有些項(xiàng)目你平時(shí)沒聽過,也可能它已經(jīng)是一個(gè)競爭激烈的行業(yè),但或許只是你沒遇見,當(dāng)你看到后認(rèn)真去了解,可能會發(fā)現(xiàn)你來做可以做得很好。
別考慮項(xiàng)目能不能賺錢,大部分項(xiàng)目都能賺錢!
別考慮藍(lán)海紅海,比拼的永遠(yuǎn)是個(gè)人競爭力!
別考慮所謂的天花板,大多數(shù)人做不到領(lǐng)域的天花板!
最后:生財(cái)有術(shù)最近在啟動抖音大航海,大家的觀點(diǎn)是:任何生意都值得再在抖音做一次。
那其實(shí)同樣的道理:任何生意都值得在別人沒做過的渠道再做一次。
請立即點(diǎn)擊咨詢我們或撥打咨詢熱線: 18653008073,我們會詳細(xì)為你一一解答你心中的疑難。項(xiàng)目經(jīng)理在線