123,123

您的位置：北京軟件開(kāi)發(fā)公司 > 新聞動(dòng)態(tài) > 行業(yè)新聞 >

北京軟件開(kāi)發(fā)公司全棧測(cè)試：平衡單元測(cè)試和端到端測(cè)試_北京軟件開(kāi)發(fā)公司

發(fā)表日期：2016-06-15 09:36:04 ?? 文章編輯：yitianxinda ?? 瀏覽次數(shù):

　　北京軟件開(kāi)發(fā)公司全棧測(cè)試：平衡單元測(cè)試和端到端測(cè)試全棧開(kāi)發(fā)人員的特點(diǎn)是能夠從頭到尾交付并發(fā)布一個(gè)特性。教程和書籍常常側(cè)重于搭建全棧開(kāi)發(fā)環(huán)境和讓測(cè)試能夠進(jìn)行所需要的“管件(plumbing)”(我綜合運(yùn)用了Angular、Rails、Bootstrap和Postgres)。但對(duì)于如何貫穿整個(gè)Web開(kāi)發(fā)棧進(jìn)行應(yīng)用程序測(cè)試，卻常常缺少指導(dǎo)。讓我們深入研究下這篇文章。我們將學(xué)習(xí)如何充分利用端到端測(cè)試，包括對(duì)測(cè)試什么以及如何保證那些測(cè)試的可靠性和可維護(hù)性進(jìn)行指導(dǎo)。我們還將談及單元測(cè)試以及它們?cè)诙说蕉藴y(cè)試策略中的作用。但首先，我們要理解編寫測(cè)試的根本目的。

　　從根本上講，測(cè)試是為了確保應(yīng)用程序的行為符合開(kāi)發(fā)者的意愿。它們是自動(dòng)化的腳本，執(zhí)行代碼并檢查其行為是否符合預(yù)期。測(cè)試編寫得越好，就越可以依賴它們?yōu)椴渴鸢殃P(guān)。如果測(cè)試不充分，就需要一個(gè)QA團(tuán)隊(duì)或者發(fā)布有缺陷的軟件(兩者均意味著用戶獲得價(jià)值的速度比理想情況慢許多)。如果測(cè)試充分，就可以自信而快速地發(fā)布，不需要批準(zhǔn)或者像QA那樣緩慢的人工過(guò)程。

　　對(duì)于編寫的測(cè)試，還必須權(quán)衡未來(lái)的可維護(hù)性。應(yīng)用程序會(huì)變，因此測(cè)試也會(huì)變。在理想情況下，測(cè)試的修改與軟件的修改是成正比的。如果你修改了一條錯(cuò)誤信息，那么你不會(huì)希望大量重寫測(cè)試套件。但是，如果你徹底地修改了一個(gè)用戶流程，那么可以預(yù)料，將有大量的測(cè)試需要重寫。

　　實(shí)際上，這意味著你無(wú)法將所有測(cè)試都作為端到端的全面集成測(cè)試，但是你也不能只進(jìn)行少得可憐的單元測(cè)試。這就關(guān)乎如何達(dá)成那種平衡。

　　測(cè)試的類型

　　測(cè)試的種類很多，但對(duì)于本文而言，我們就談?wù)搩深悾憾说蕉藴y(cè)試和單元測(cè)試。

　　端到端測(cè)試模擬用戶行為。在Web應(yīng)用程序中，他們會(huì)啟動(dòng)服務(wù)器，打開(kāi)瀏覽器，到處點(diǎn)擊，斷言瀏覽器中發(fā)生了特定的事情，讓我們相信功能可以正常運(yùn)行。這些測(cè)試會(huì)給我們巨大的信心，但是它們緩慢而脆弱，并且同用戶界面緊密地耦合在了一起。

　　單元測(cè)試根據(jù)代碼單元的公共API運(yùn)行它們。這些測(cè)試需要?jiǎng)?chuàng)建一個(gè)類的實(shí)例，使用特定的輸入調(diào)用它的方法，斷言被調(diào)用的方法達(dá)到了預(yù)期的效果(通常是返回了預(yù)期的輸出)。這些測(cè)試快速而穩(wěn)定，并且不會(huì)同系統(tǒng)的其他部分緊密地耦合在一起。不過(guò)，它們無(wú)法讓你相信整個(gè)系統(tǒng)可以正常運(yùn)行——只是測(cè)試過(guò)的代碼單元可以正常運(yùn)行。

　　構(gòu)建一項(xiàng)特性的任務(wù)就是要在兩類測(cè)試之間找到恰當(dāng)?shù)钠胶恻c(diǎn)。如果端到端測(cè)試太多，那么未來(lái)修改應(yīng)用程序就會(huì)痛苦而緩慢。如果太少，那么一些不易覺(jué)察的缺陷就會(huì)進(jìn)入到生產(chǎn)環(huán)境，即使快速測(cè)試套件的代碼覆蓋率為100%。

　　從用戶體驗(yàn)入手

　　你的軟件是向某個(gè)用戶提供服務(wù)，因此，那個(gè)用戶應(yīng)該推動(dòng)你的工作。我不建議使用測(cè)試來(lái)設(shè)計(jì)用戶體驗(yàn)，因此，要在編寫測(cè)試之前弄清楚用戶將如何使用軟件(要么通過(guò)試驗(yàn)性代碼，要么同一名設(shè)計(jì)師一起工作)。一旦弄清楚了，就可以開(kāi)始工作了。

　　在理想情況下，你將為用戶體驗(yàn)的某個(gè)部分創(chuàng)建端到端的測(cè)試，并編寫代碼讓其通過(guò)測(cè)試。在編寫那些代碼的時(shí)候，你會(huì)創(chuàng)建單元測(cè)試，具體化需要?jiǎng)?chuàng)建或修改(通常是后者)的代碼的規(guī)范。

　　問(wèn)題是，編寫沒(méi)有用戶界面工件(HTML)可供參考的、端到端的失敗測(cè)試很難。這是因?yàn)?，大部分端到端測(cè)試的形式都是：

　　找到頁(yè)面上的某個(gè)元素;

　　通過(guò)某種方式同它交互;

　　證實(shí)交互成功;

　　重復(fù)上述過(guò)程直到測(cè)試結(jié)束。

　　這意味著，圍繞要發(fā)生交互的用戶界面元素(DOM對(duì)象)，你需要有一些規(guī)范。當(dāng)把以JavaScript為基礎(chǔ)的交互設(shè)計(jì)考慮在內(nèi)時(shí)，如果不實(shí)際地構(gòu)建界面，至少是部分地構(gòu)建，就更難測(cè)試了。

　　為此，要讓一個(gè)粗略的UI輪廓在瀏覽器中運(yùn)行起來(lái)。使用預(yù)先準(zhǔn)備好的數(shù)據(jù)，并且不需要考慮備選流程——一次專注于一件事。它運(yùn)行起來(lái)以后，就可以編寫測(cè)試了。

　　在這樣做的時(shí)候，有兩點(diǎn)需要考慮：這個(gè)特性需要測(cè)試嗎?如果需要，該如何測(cè)試?

　　測(cè)試什么

　　雖然在編程上沒(méi)有愉快路徑，但用戶經(jīng)歷的代碼路徑要比代碼的可能路徑少許多。例如，當(dāng)用戶購(gòu)買一款產(chǎn)品，根據(jù)用戶地址、選擇的發(fā)貨方式或者以前的購(gòu)買歷史，我們可能會(huì)用不同的方式處理訂單。在所有情況下，用戶的體驗(yàn)都是一樣的，這樣,在用戶看來(lái)，流程只有一個(gè)。

　　這時(shí)，你的目標(biāo)是測(cè)試所有的用戶流程。你需要一個(gè)測(cè)試套件，模擬一個(gè)用戶做你想要并希望他做的事，并斷言你想要提供給該用戶的所有體驗(yàn)都工作正常。

　　假如你已經(jīng)知道要測(cè)試什么，那應(yīng)該如何進(jìn)行呢?

　　如何進(jìn)行端到端測(cè)試

　　如果修改了一個(gè)流程，那么就要修改那個(gè)流程的測(cè)試。由于端到端測(cè)試模擬用戶活動(dòng)，所以不需要為想要斷言的每件事情都編寫一個(gè)測(cè)試。如果用戶應(yīng)該在結(jié)算界面上看到三段重要的信息，就不需要編寫三個(gè)測(cè)試——一個(gè)測(cè)試檢查所有三段信息就足夠了。因此，當(dāng)修改一個(gè)現(xiàn)有的用戶體驗(yàn)時(shí)，要找一個(gè)現(xiàn)有的、可以改進(jìn)的測(cè)試。

　　否則，就需要一個(gè)新的測(cè)試。記住，你的目標(biāo)是模擬用戶要做的事情。務(wù)必要對(duì)如何組織測(cè)試中的導(dǎo)航和行為開(kāi)誠(chéng)布公。用戶真地會(huì)直接導(dǎo)航到某些深層鏈接嗎?或者他們會(huì)點(diǎn)擊某個(gè)公用的開(kāi)始頁(yè)面從而到達(dá)他們需要到達(dá)的地方嗎?

　　這很難做，尤其是通常要使用較少的標(biāo)記實(shí)現(xiàn)該功能。測(cè)試需要定位特定的DOM元素同其交互，而準(zhǔn)確找到你想要同其交互的元素并不總是很簡(jiǎn)單(或者可能)。你需要“標(biāo)識(shí)(signpost)”。

　　標(biāo)識(shí)是專門插入DOM中用于定位感興趣的元素的。要盡早確定這些標(biāo)識(shí)如何發(fā)揮作用。不應(yīng)該使用原本用于樣式化的CSS類來(lái)定位DOM元素。這樣做意味著前端開(kāi)發(fā)人員改變類名就會(huì)破壞測(cè)試。也不應(yīng)該使用被JavaScript代碼使用的CSS類或數(shù)據(jù)屬性(比如前綴為js-的類)。這會(huì)帶來(lái)同樣的破壞。

　　使用前綴為test-的CSS類或者前綴為data-test-的屬性是兩種常用的技術(shù)：

　　這可能看上去讓人不舒服……也確實(shí)是。但是，與將測(cè)試耦合到內(nèi)容或者展示類相比，這就不那么令人討厭了。這里，你需要尋求一種平衡——不要盲目地使用data-test屬性標(biāo)記每個(gè)元素。例如，如果你想點(diǎn)擊一個(gè)購(gòu)買特定產(chǎn)品的按鈕，那么你真正需要的只是定位某個(gè)包含那款產(chǎn)品及購(gòu)買按鈕的元素。

　　添加data-test-product屬性后，你就能夠使用一個(gè)像[data-test-product='1234'] input[type='submit']這樣的CSS選擇器定位產(chǎn)品1234的購(gòu)買按鈕了。

　　這意味著你必須修改只為測(cè)試而存在的標(biāo)記，就是說(shuō)，為了獲得你提供給他們的用戶體驗(yàn)，用戶要下載一些他們不需要的字節(jié)。這是一種平衡，但比糟糕的測(cè)試覆蓋率(對(duì)用戶的傷害遠(yuǎn)遠(yuǎn)超過(guò)了HTML中多一些額外的字節(jié))要好。只是得恰到好處。

　　當(dāng)頁(yè)面上有改變頁(yè)面內(nèi)容而又不重新加載的交互(換句話說(shuō)，使用JavaScript)時(shí)，這項(xiàng)技術(shù)就更加重要了。

　　處理交互

　　當(dāng)每次點(diǎn)擊都重新加載頁(yè)面時(shí)，端到端測(cè)試更可靠，因?yàn)榈讓庸ぞ咧酪却粋€(gè)頁(yè)面重新加載。當(dāng)用戶交互只是改變DOM時(shí)，難度就大了，因?yàn)楣ぞ卟恢朗裁?ldquo;事情”正在發(fā)生，也就無(wú)法“等待事情完成”。

　　當(dāng)測(cè)試需要同一個(gè)不會(huì)根據(jù)用戶動(dòng)作重新加載的頁(yè)面交互時(shí)，就需要一種方法能夠在開(kāi)始斷言發(fā)生了什么之前等待DOM操作完成。如果不等待，那么如果測(cè)試開(kāi)始斷言時(shí)DOM還沒(méi)有更新，測(cè)試就會(huì)無(wú)謂地失敗。

　　就像在標(biāo)記中使用標(biāo)識(shí)定位要操作的DOM元素一樣，我們也可以把它們用在這里。任何新增或變化的標(biāo)記都應(yīng)該有某種在交互失敗或沒(méi)有發(fā)生的情況下不會(huì)出現(xiàn)的標(biāo)識(shí)。換句話說(shuō)，你不必為了等待DOM事件而在測(cè)試中進(jìn)行休眠調(diào)用——DOM中應(yīng)該包含可供測(cè)試顯式等待的標(biāo)識(shí)。

　　例如，假設(shè)我們想要測(cè)試一個(gè)動(dòng)作為用戶生成了一條成功的消息。假設(shè)實(shí)現(xiàn)方法是發(fā)出一個(gè)AJAX請(qǐng)求，當(dāng)調(diào)用結(jié)束時(shí)向DOM中插入一條消息。一個(gè)基本的實(shí)現(xiàn)可以像下面這樣做：

　　function purchase(productId) {

　　$.post(

　　"/products/",

　　{ "id": productId }

　　).done(function() {

　　$(".header").html(

　　Your order was placed

　　");

　　}).fail(function() {

　　$(".header").html(

　　There was a problem

　　");

　　});

　　你可以通過(guò)配置讓測(cè)試等待一個(gè)使用了CSS類alert-success的元素出現(xiàn)，然后斷言它的內(nèi)容。這意味著，如果頁(yè)面需要任何其他使用那個(gè)類的元素，那么測(cè)試就會(huì)不可靠或被破壞。雖然你可以將其限制在HTML頭里，但這只是緩兵之計(jì)。

　　作為替代，可以使用data-test-屬性：

　　function purchase(productId) {

　　$.post(

　　"/products/",

　　{ "id": productId }

　　).done(function() {

　　$(".header").html(

　　Your order was placed

　　");

　　}).fail(function() {

　　$(".header").html(

　　There was a problem

　　");

　　});

　　雖然這增加了標(biāo)記的字節(jié)，但它讓你可以編寫一個(gè)能夠不受某些視覺(jué)變化影響的可靠測(cè)試。只要頁(yè)面流程是在一次成功的購(gòu)買后顯示一條消息，那么可視化實(shí)現(xiàn)就可以修改而又不破壞測(cè)試。這是你想要的，這是一種權(quán)衡。你也可以犧牲掉這份自信，創(chuàng)建較小較起碼的標(biāo)記，但當(dāng)顯示效果變化時(shí)，你要么花時(shí)間修復(fù)測(cè)試，被迫手動(dòng)QA，要么就發(fā)布沒(méi)有經(jīng)過(guò)充分測(cè)試的軟件。

　　如今的端到端測(cè)試工具，如Capybara，包含你需要的所有功能。它提供了方法，可以在繼續(xù)測(cè)試過(guò)程之前等待DOM元素出現(xiàn)，斷言頁(yè)面特定部分的內(nèi)容，同表單元素交互。大多數(shù)其他Web應(yīng)用程序棧都提供了類似的工具。不管怎樣，你可以將測(cè)試庫(kù)與像PhantomJS這樣的無(wú)界面瀏覽器結(jié)合，從而使端到端測(cè)試出奇地快速可靠。

　　還有一點(diǎn)值得注意，就是在一個(gè)分布式的環(huán)境中如何完成這項(xiàng)工作。

　　當(dāng)“應(yīng)用”多于一個(gè)

　　當(dāng)對(duì)單個(gè)整體系統(tǒng)進(jìn)行測(cè)試時(shí)，上述技術(shù)就完全夠用了。然而，如果是對(duì)一個(gè)較為分散的系統(tǒng)進(jìn)行測(cè)試，情況就要復(fù)雜些了。假設(shè)你正致力于一個(gè)面向客戶的應(yīng)用程序，但它必須從另一個(gè)系統(tǒng)獲取庫(kù)存數(shù)據(jù)。你如何為此編寫一個(gè)測(cè)試呢?

　　首先，記住你在測(cè)試什么。端到端測(cè)試是測(cè)試用戶交互。這意味著，端到端測(cè)試不用負(fù)責(zé)斷言遠(yuǎn)程服務(wù)的功能，也不用負(fù)責(zé)斷言應(yīng)用程序正確地消費(fèi)了那個(gè)遠(yuǎn)程服務(wù)。

　　測(cè)試服務(wù)消費(fèi)的較佳方式是使用“消費(fèi)者驅(qū)動(dòng)的契約(consumer-driven contracts)”，這是一種單元測(cè)試的形式(至少在這篇博文中我所做的寬泛界定中是這樣)。

　　對(duì)于在端到端測(cè)試中如何模擬遠(yuǎn)程服務(wù)，至此仍然沒(méi)有定論。你可以搭建該服務(wù)的一個(gè)實(shí)際版本，但這并不是很好。你較終不得不管理那個(gè)服務(wù)的內(nèi)部數(shù)據(jù)存儲(chǔ)以及它所依賴的服務(wù)。那會(huì)使復(fù)雜性迅速增加，難以管理。

　　一個(gè)常見(jiàn)的選擇是使用一個(gè)HTTP層的模擬系統(tǒng)。在Ruby中，VCR是一款具備這種功能的工具。你錄制同真實(shí)服務(wù)交互以建立HTTP協(xié)議往返的過(guò)程，在隨后運(yùn)行測(cè)試時(shí)，模擬系統(tǒng)會(huì)回放錄制好的交互，而不必使用網(wǎng)絡(luò)。如果單元測(cè)試覆蓋了服務(wù)的正確消費(fèi)，那么這對(duì)于端到端測(cè)試就會(huì)很有效。

　　另一個(gè)選擇是搭建一個(gè)經(jīng)過(guò)簡(jiǎn)化的模擬服務(wù)，該服務(wù)返回預(yù)先準(zhǔn)備好的數(shù)據(jù)。應(yīng)用會(huì)像平常一樣進(jìn)行HTTP調(diào)用，但調(diào)用的是一個(gè)預(yù)先準(zhǔn)備好、只向應(yīng)用返回靜態(tài)已知數(shù)據(jù)的服務(wù)。這需要提前做些配置，但對(duì)簡(jiǎn)單的服務(wù)交互很有效。如果應(yīng)用程序需要在服務(wù)中存儲(chǔ)狀態(tài)，并有一個(gè)漫長(zhǎng)的往返“對(duì)話”，那么這項(xiàng)技術(shù)就要難一些了。

　　我的建議是首先嘗試模擬HTTP，因?yàn)槟羌群?jiǎn)單又快捷。

　　現(xiàn)在，我們知道在端到端測(cè)試中測(cè)試什么以及如何測(cè)試，那么單元測(cè)試呢?

　　單元測(cè)試

　　回想一下，對(duì)于什么應(yīng)該進(jìn)行端到端的測(cè)試，我們的標(biāo)準(zhǔn)是用戶流程。其思想是，雖然整個(gè)系統(tǒng)有許多可能的邏輯流程，但能對(duì)用戶體驗(yàn)產(chǎn)生影響的要少很多。單元測(cè)試就是要測(cè)試那些邏輯流程的剩余部分。

　　這讓我們可以快速可靠地?cái)嘌韵到y(tǒng)大部分功能的正確行為。換句話說(shuō)，雖然我們可以使用端到端測(cè)試斷言整個(gè)系統(tǒng)中每個(gè)可能的流程，但那沒(méi)有必要，而且會(huì)非常緩慢和脆弱。

　　例如，假設(shè)一個(gè)結(jié)算功能有兩個(gè)用戶流程：一個(gè)是購(gòu)買成功，一個(gè)是購(gòu)買失敗，用戶必須重試。那會(huì)有兩個(gè)端到端測(cè)試。讓我們進(jìn)一步假設(shè)，后臺(tái)有如下可能性：

　　客戶的信用卡正確扣款;

　　與客戶銀行的通信存在問(wèn)題，但我們想假裝它是成功的，并在稍后扣款;

　　客戶的信用卡被拒絕;

　　客戶的信用卡過(guò)期。

　　這是四個(gè)流程，所以我們希望有四個(gè)單元測(cè)試可以斷言其中每一種情況都得到了正確處理。是的，會(huì)有重復(fù)覆蓋。在端到端測(cè)試中，我們可能會(huì)創(chuàng)建成功扣款和拒絕兩個(gè)測(cè)試來(lái)處理該功能的兩個(gè)用戶流程，因此，當(dāng)編寫單元測(cè)試時(shí)，我們的覆蓋率就會(huì)超過(guò)理論上的需要。

　　再一次，這是一種權(quán)衡，但重要的是，單元測(cè)試可以很好地覆蓋你的類。這就允許它們改變位置、用途，而且更容易修改。

　　關(guān)于如何編寫單元測(cè)試，有許多許多的理論，遠(yuǎn)遠(yuǎn)超出了我們這里的討論范圍。我的建議是采用一種對(duì)你有用同時(shí)也容易跟別人解釋的技術(shù)，并一直使用。

　　對(duì)于單元測(cè)試，較困難的部分是決定代碼設(shè)計(jì)要在多大程度上為測(cè)試考慮。這就類似我們?nèi)绾螢榱藴y(cè)試向HTML中增加屬性和其他標(biāo)識(shí)——那些工件只是因?yàn)槲覀円獪y(cè)試而存在。在編寫單元測(cè)試時(shí)，你會(huì)面臨同樣的選擇。

　　例如，假設(shè)Purchaser類實(shí)現(xiàn)了信用卡扣款代碼。假設(shè)它將使用第三方提供的AwesomePayments進(jìn)行實(shí)際地扣款。

　　class Purchaser

　　def charge(purchase)

　　AwesomePayments.charge(purchase.customer.id,purchase.amount)

　　rescue => ex

　　try_again_later(purchase.id)

　　end

　　# ...

　　end

　　上述代碼清晰易懂，在不需要單元測(cè)試的情況下，這可能是較理想的設(shè)計(jì)了。然而，為了讓測(cè)試更簡(jiǎn)單，我們可能想控制AwesomePayments的實(shí)例：

　　class Purchaser

　　def initialize(awesome_payments = AwesomePayments)

　　@awesome_payments = awesome_payments

　　end

　　def charge(purchase)

　　@awesome_payments.charge(purchase.customer.id,purchase.amount)

　　rescue => ex

　　try_again_later(purchase.id)

　　end

　　現(xiàn)在，就可以在測(cè)試時(shí)傳入AwesomePayments的模擬實(shí)現(xiàn)，從而更好地控制測(cè)試。測(cè)試已經(jīng)影響了我們的設(shè)計(jì)(雖然這里的影響比較小)。你甚至可以說(shuō)，這個(gè)類就是更好的代碼。但情況并非總是如此。

　　我會(huì)使用同你處理端到端測(cè)試一樣的標(biāo)準(zhǔn)：做讓生活更輕松的事，但不要做過(guò)頭，務(wù)必要恰到好處。