无套内谢少妇毛片免费看_免费无码一级成年片_亚洲欧美在线视频播放_国语对白久久香肠

全國
電話:0535-6730782
  • 微信公眾平臺
  • 個人求職客服
  • 企業(yè)招聘客服
  • 您當(dāng)前的位置:首頁 > 職場熱點(diǎn) >百度筆試題目分享

    百度筆試題目分享

    來源:過來人求職網(wǎng) 時間:2012-09-13
    核心提示:用C語言實現(xiàn)一個revert函數(shù),它的功能是將輸入的字符串在原串上倒序后返回。
                  編程:

      用C語言實現(xiàn)一個revert函數(shù),它的功能是將輸入的字符串在原串上倒序后返回。

      2 編程:

      用C語言實現(xiàn)函數(shù)void * memmove(void *dest,const void *src,size_t n)。memmove函數(shù)的功能是拷貝src所指的內(nèi)存內(nèi)容前n個字節(jié)到dest所指的地址上。

      3 英文拼寫糾錯:

      在用戶輸入英文單詞時,經(jīng)常發(fā)生錯誤,我們需要對其進(jìn)行糾錯。假設(shè)已經(jīng)有一個包含了正確英文單詞的詞典,請你設(shè)計一個拼寫糾錯的程序。

      (1)請描述你解決這個問題的思路;

      (2)請給出主要的處理流程,算法,以及算法的復(fù)雜度;

      (3)請描述可能的改進(jìn)(改進(jìn)的方向如效果,性能等等,這是一個開放問題)。

      4 尋找熱門查詢:

      搜索引擎會通過日志文件把用戶每次檢索使用的所有檢索串都記錄下來,每個查詢串的長度為1-255字節(jié)。假設(shè)目前有一千萬個記錄,這些查詢串的重復(fù)度比較高,雖然總數(shù)是1千萬,但如果除去重復(fù)后,不超過3百萬個。一個查詢串的重復(fù)度越高,說明查詢它的用戶越多,也就是越熱門。請你統(tǒng)計最熱門的10個查詢串,要求使用的內(nèi)存不能超過1G。

      (1)請描述你解決這個問題的思路;

      (2)請給出主要的處理流程,算法,以及算法的復(fù)雜度。

      5 集合合并:

      給定一個字符串的集合,格式如: {aaa bbb ccc}, {bbb ddd},{eee fff},{ggg},{ddd hhh} 要求將其中交集不為空的集合合并,要求合并完成后的集合之間無交集,例如上例應(yīng)輸出 {aaa bbb ccc ddd hhh},{eee fff}, {ggg}

      (1)請描述你解決這個問題的思路;

      (2)請給出主要的處理流程,算法,以及算法的復(fù)雜度

      (3)請描述可能的改進(jìn)(改進(jìn)的方向如效果,性能等等,這是一個開放問題)。

      ////////////////////////////////

      1 題

      char *revert(char * str)

      {

      int n=strlen(str);

      int i=0;

      char c;

      for(i=0;i {

      c=str;

      str=str[n-i];

      str[n-i]=c;

      }

      return str;

      }

      ///////////////////////////////////

      2 題

      void * memmove(void *dest,const void *src,size_t n)

      {

      assert((dest!=0)&&(src!=0));

      char * temp=(char * )dest;

      char * ss=(char * )src;

      int i=0;

      for(;i {

      *temp =*ss ;

      }

      return temp;

      }

      /////////////////////////////////////////////////

      3 題

      (1)思路: 字典以字母鍵樹組織,在用戶輸入同時匹配

      (2) 流程:

      每輸入一個字母:

      沿字典樹向下一層,

      a)若可以順利下行,則繼續(xù)至結(jié)束,給出結(jié)果;

      b)若該處不能匹配,糾錯處理,給出拼寫建議,繼續(xù)至a);

      算法:

      1.在字典中查找單詞

      字典采用27叉樹組織,每個節(jié)點(diǎn)對應(yīng)一個字母,查找就是一個字母

      一個字母匹配.算法時間就是單詞的長度k.

      2.糾錯算法

      情況:當(dāng)輸入的最后一個字母不能匹配時就提示出錯,簡化出錯處理,動態(tài)提示可能 處理方法:

      (a)當(dāng)前字母前缺少了一個字母:搜索樹上兩層到當(dāng)前的匹配作為建議;

      (b)當(dāng)前字母拼寫錯誤:當(dāng)前字母的鍵盤相鄰作為提示;(只是簡單的描述,可 以有更多的)

      根據(jù)分析字典特征和用戶單詞已輸入部分選擇(a),(b)處理

      復(fù)雜性分析:影響算法的效率主要是字典的實現(xiàn)與糾錯處理

      (a)字典的實現(xiàn)已有成熟的算法,改進(jìn)不大,也不會成為瓶頸;

      (b)糾錯策略要簡單有效 ,如前述情況,是線性復(fù)雜度;

      (3)改進(jìn)

      策略選擇最是重要,可以采用統(tǒng)計學(xué)習(xí)的方法改進(jìn)。

      //////////////////////////////////////////////

      4 題

      (1)思路:用哈希做

      (2) 首先逐次讀入查詢串,算哈希值,保存在內(nèi)存數(shù)組中,同時統(tǒng)計頻度(注意值與日志項對應(yīng)關(guān)系) my.chinahrlab.com 選出前十的頻度,取出對應(yīng)的日志串,簡單不過了。哈希的設(shè)計是關(guān)鍵。

      //////////////////////////////////////////////////

      5 題

      (1)思路:先將集合按照大小排列后,優(yōu)先考慮小的集合是否與大的集合有交集。有就合并,如果小集合與所有其他集合都沒有交集,則獨(dú)立。獨(dú)立的集合在下一輪的比較中不用考慮。這樣就可以盡量減少字符串的比較次數(shù)。當(dāng)所有集合都獨(dú)立的時候,就終止。

      (2)處理流程:

      1.將集合按照大小排序,組成集合合并待處理列表

      2.選擇最小的集合,找出與之有交集的集合,如果有,合并之;如果無,則與其它集合是獨(dú)立集合,從待處理列表 中刪除。

      3.重復(fù)直到待處理列表為空

      算法: 1。將集合按照大小從小到大排序,組成待處理的集合列表。 2。取出待處理集合列表中最小的集合,對于集合的每個元素,依次在其他集合中搜索是否有此元素存在:

      1>若存在,則將此小集合與大集合合并,并根據(jù)大小插入對應(yīng)的位置 。轉(zhuǎn)3。

      2>若不存在,則在該集合中取下一個元素。如果無下一個元素,即所有元素都不存在于其他集合。則表明此集合獨(dú)立,從待處理集合列表中刪除。并加入結(jié)果集合列表。轉(zhuǎn)3。

      3。如果待處理集合列表不為空,轉(zhuǎn)2。

      如果待處理集合列表為空,成功退出,則結(jié)果集合列表就是最終的輸出。

      算法復(fù)雜度分析:

      假設(shè)集合的個數(shù)為n,最大的集合元素為m 排序的時間復(fù)雜度可以達(dá)到n*log(n) 然后對于元素在其他集合中查找,最壞情況下為(n-1)*m 查找一個集合是否與其他集合有交集的最壞情況是m*m*(n-1) 合并的時間復(fù)雜度不會超過查找集合有交集的最壞情況。所以最終最壞時間復(fù)雜度為O(m*m*n*n)

      需要說明的是:此算法的平均時間復(fù)雜度會很低,因為無論是查找還是合并,都是處于最壞情況的概率很小,而且排序后優(yōu)先用最小集合作為判斷是否獨(dú)立的對象,優(yōu)先與最大的集合進(jìn)行比較,這些都最大的回避了最壞情況。

      (3)可能的改進(jìn):

      首先可以實現(xiàn)將每個集合里面的字符串按照字典序進(jìn)行排列,這樣就可以將查找以及合并的效率增高。另外,可能采取恰當(dāng)?shù)臄?shù)據(jù)結(jié)構(gòu)也可以將查找以及合并等操作的效率得到提高。

      、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、

      1)此題10分

      對任意輸入的正整數(shù)N,編寫C程序求N!的尾部連續(xù)0的個數(shù),并指出計算復(fù)雜度。如:18!=6402373705728000,尾部連續(xù)0的個數(shù)是3。   (不用考慮數(shù)值超出計算機(jī)整數(shù)界限的問題)

      2)此題10分   編寫一個C語言函數(shù),要求輸入一個url,輸出該url是首頁、目錄頁或者其他url

      如下形式叫做首頁:

      militia.info/

      www.apcnc.com.cn/

      http://www.cyjzs.comwww.greena888.com/

      www.800cool.net/

      http://hgh-products.my-age.net/

      如下形式叫做目錄頁:

      thursdaythree.net/greenhouses--gas-global-green-house-warming/

      http://www.mw.net.tw/user/tgk5ar1r/profile/

      http://www.szeasy.com/food/yszt/chunjie/

      www.fuckingjapanese.com/Reality/

      請注意:

      a) url有可能帶http頭也有可能不帶

      b)動態(tài)url(即含有"?"的url)的一律不算目錄頁,如:

      www.buddhismcity.net/utility/mailit.php?l=/activity/details/3135/

      www.buddhismcity.net/utility/mailit.php?l=/activity/details/2449/

      另:如果你會linux,請用linux下的grep命令實現(xiàn)第2題的功能(附加5分)。

      3)此題40分

      如果必須從網(wǎng)頁中區(qū)分出一部分"重要網(wǎng)頁"(例如在10億中選8億),比其他網(wǎng)頁更值得展現(xiàn)給用戶,請?zhí)岢鲆环N方案。

      4)此題40分

      假設(shè)有10億網(wǎng)頁已經(jīng)被我們存下來,并提供如下信息:網(wǎng)頁全文(即網(wǎng)頁的源碼)、全文長度、網(wǎng)頁正文(即網(wǎng)頁中提取的主體文字)、正文長度,以及其他網(wǎng)頁提取物等,現(xiàn)在希望去掉其中的重復(fù)網(wǎng)頁,請?zhí)岢隹尚械姆桨,計算出每個網(wǎng)頁對應(yīng)的重復(fù)度,你可以自己對網(wǎng)頁重復(fù)下定義,也可以提出需要哪些更多的網(wǎng)頁提取物來實現(xiàn)更好的去重復(fù)方案。

    分享: 分享到新浪微博
    分享到QQ空間
    微信公眾號
    手機(jī)瀏覽

    ©2008-2022 煙臺富美特信息科技 All Rights Reserved 魯ICP備14027462號-3

    魯公網(wǎng)安備 37060202000179號

    用微信掃一掃