Leetcode scala
- Scala是如何看待编程和其中的问题的。Scala的目标,Scala的手段,Scala的效果。
- 能在编译期做的约束和检查,就不要延迟到运行时。例如,ADT
- https://jaxenter.com/cheat-sheet-complete-guide-scala-136558.html
- http://rea.tech/java-to-scala-cheatsheet/
- https://alvinalexander.com/downloads/scala/Scala-Cheat-Sheet-devdaily.pdf
- https://github.com/lampepfl/progfun-wiki/blob/gh-pages/CheatSheet.md
- https://mbonaci.github.io/scala/
- https://docs.scala-lang.org/cheatsheets/
- 列表解析式
- 函数一等公民
- 鸭子类型
- 尾递归
- 代数类型
- 模式匹配
- 伴生对象
- Non-Strict (lazy), Strict, WithFilter.
- 不可变性
- 闭包
- Monad
- 类型系统
- Implicits
- https://alexn.org/blog/2017/01/30/asynchronous-programming-scala.html
- https://github.com/scala/scala-async
- https://scalerablog.wordpress.com/2016/10/03/algrebraic-data-types-in-scala/
- https://wiki.haskell.org/Algebraic_data_type
- https://pawelwlodarski.gitbooks.io/functional-programming/content/
- http://docs.scala-lang.org/tutorials/FAQ/yield.html 的最后部分,Range(1,10).xxx 和 List(1,10).xxx 会返回不同的结果。
- 对于FP的批判:http://queue.acm.org/detail.cfm?ref=rss&id=2611829&utm_content=bufferb88da 貌似作者挑一个奇怪的例子,不一定站得住脚。
- http://docs.scala-lang.org/tutorials/FAQ/index.html
- http://docs.scala-lang.org/overviews/core/architecture-of-scala-collections.html 对于Scala Collection 架构的官方介绍。
- https://twitter.github.io/scala_school
- 闭包没什么,闭包可以做的事情,你创建个类一样,可以做。闭包,有些时候,你的函数依赖于外部变量,你就需要他。如果,不支持,写程序就比较麻烦。
- https://www.artima.com/pins1ed/functions-and-closures.html
- 持续理解
- 我造个例子, 你有账户的钱用一个变量表示。有人不停的给你转账,1万,2万,3万...,你的加到你的账户里。
scala> var myMoney = 100
myMoney: Int = 100
scala> def addMoney(more:Int) = {myMoney += more } //这就是个闭包,负责给我加钱的逻辑
addMoney: (more: Int)Unit
scala> Range(1,10).foreach{ addMoney(_) }
scala> myMoney //钱到帐了,哈哈
res27: Int = 145
× 如果闭包抓到的是val, 是没有多大意思的,和普通函数没区别。
- 关键的问题,为什么不把这个变量以参数的形式传进去。上面的例子是,我传进去是达不到效果的。
- 程序的本质就是如何组织数据和计算逻辑,而计算逻辑和数据是要交互,计算逻辑是要依据数据做计算,并改变数据。所以,闭包就是和数据联系起来的计算逻辑,类也是将数据和计算联系起来了,只是出发点不同,类的角度是带有计算逻辑的数据,从数据出发,所以,类先有变量成员,再有方法成员;而闭包是带有数据的计算逻辑,从函数出发。JavaScript就可以用闭包来模拟面向对象的特性。会JavaScript的人更能深刻理解闭包。(找JavaScript的人求证?)
- 闭包能做的事情,用其他工具或者概念也能做,只是会比较麻烦。期待举个例子?
- 纯函数没能力改变数据,或者引用一直在变的状态,但纯函数很强大,可以传来传去;为了能利用纯函数的强大和数据交互的需求,我需要一个闭包的概念。让纯函数带上状态飞,带上状态就是闭包, 可以standalone, 从而可以到处传递,可以按照函数式编程的方式,投放到各种计算框架中。
- ADT与模式匹配介绍: https://pawelwlodarski.gitbooks.io/functional-programming/content/workshop_-_adt.html
- 模式匹配官方文档: https://www.scala-lang.org/files/archive/spec/2.11/08-pattern-matching.html
- 可以做模式匹配的类型:原始类型,case class, ADT. apply & unapply?
- https://twitter.github.io/scala_school/pattern-matching-and-functional-composition.html CASE语句的本质是偏函数和函数组合(function compose). 因为是偏函数,所以,case语句的语法是 case <sub_set_value_pattern> => <return_value>,符合函数的定义方式。(Int) => String
//一个函数定义的例子。
val addOne:(Int) => Int = (e:Int) => e + 1
//Twitter scala school的例子
scala> val one: PartialFunction[Int, String] = { case 1 => "one" }
one: PartialFunction[Int,String] = <function1>
scala> one.isDefinedAt(1)
res0: Boolean = true
scala> one.isDefinedAt(2)
res1: Boolean = false
- 模式匹配支持按那些维度匹配
- 类型: case x: List[_] => xxx (http://exercism.io/tracks/scala/exercises/flatten-array)
- Predicate: case x if predicate(x) => xxx
- 值: case 1 => xxx
- 有些时候,不一定因为case好用,就非要case展开,有些时候,是尽量避免展开的(例如Option), 相关题目:http://exercism.io/exercises/scala/binary-search-tree/readme
-
把函数理解为一个计算逻辑。或者就理解为数学上的函数定义。集合->映射->函数. 不管,你具体怎么做的,只要映射一致,你们就是相同的函数。所以,函数更关心结果不关心过程。
-
函数可以认为是一个计算逻辑。特例,表达式
-
静态分析。
-
直接看DevelopmentKit的源代码。
-
看背后思想,发展历史。
-
搞清楚语言内核
-
和其他相关语言,对比分析
-
编译后指令的查看
-
动态分析
-
Debug.
-
println/log. println 是利器。能比较快捷和清除地搞清楚我们所关系的执行顺序,某个执行点的上下文(相关变量的值) 例如,https://alvinalexander.com/scala/examples-shows-differences-between-strict-lazy-evaluation-in-scala
-
Performance
-
练习体会
-
实际项目
- scalac -print
- javap
- 减少程序的复杂度,让编译器做更多工作。
- 函数式编程的一些概念和设计,譬如说,不变量,无副作用的函数,这是对函数和值引用的一些约束,有了这些约束,一方面,人就更容易推理或者预测程序的行为;另一方面,这些约束也可以为机器所利用,有了这些约束,某些计算是不是可以并行计算。
- 函数作为一等公民也可以减少复杂度?
-
http://exercism.io/submissions/0edc95b2e4a84d61a02942b52914d20c
-
在做sieve这道题的时候,学习到了一些简单的东西。我的解决方案还是老式的思想,脑子有个数组,然后,循环访问这个标记数组;虽然用到的takeWhile, 但总觉得别扭。
-
不用老式的for/while循环思想,Scala中,就是以流或者序列(Seq)为起点,做各种变换和计算。在序列上,可以有各种各样的操作模式 * 序列的模式匹配,x::xs. 序列的分解 * 取序列的某些部分 * head,tail,init * takeWhile * 略过序列的前面某些部分:
- drop(n)
- dropWhile() * 与index相关的操作
- indexWhile * fold操作, 遍历的过程中,计算并记住一些与已扫描元素的结果,与reduce有何区别?至少,reduceLeft是foldLeft的特例。foldLeft是要提供初始元素的。 * slibing. 固定窗口大小滑动,依次计算。
- groupBy. Like SQL group by.
- 产生无限序列:Stream.from(1)
-
Scala的视角不一样,更多地是从数学角度,而不是计算机(CPU, 内存操作)角度。Scala的Seq就被建模为一种自然数到元素类型集合的PartialFunction(部分函数, 标准的译法是偏函数)。题外话,很多时候,你都要去看一样英文的数学概念,才能更好的理解Scala, 中文的数学概念翻译都不准确,偏函数,偏序关系,都很难从字面理解,而英文中,就是partial function, total function, partial order, total order,从字面意思上就能很好的理解,不是所有的元素又有对应的函数或者序关系,就是部分函数或者部分序关系,所以,花精力看英文的数学概念解释是有必要的。 回归正题,将Seq建模为部分函数PartialFunction[Int, B], 你就比较容易理解Seq数据结构怎样通过下标访问:seq(n).而在C及类似语言中,我们的思想都类似数组,数组的访问其实是数组的内存地址加上index * sizeof(lementType)。所以,C语言的开发者,一开始还是很难适应的。
-
不要mutable,用了mutable,就会倾向于老式的思想。
-
不用Break, 用takeWhile可以替代。
-
递归的思想,函数编程更喜欢递归,正常情况下,C语言的递归也无副作用。递归的这种特征和函数编程很一致。是吗?
- 今天,我又刷了题目http://exercism.io/tracks/scala/exercises/meetup, 记一下刷后感。
- 在Debug的时候,发现IntelliJ IDEA可以在匿名函数处设置断点,譬如说,list.find(_ > 0),那么,就可以在 _ > 0处设置断点。
- Range.slice 和 List.slice 是不一样的,前者是lazy的,后者是eager的
- List.withFilter是lazy的,返回值具有FilterMondadic trait. withFilter就可以组合了: https://alvinalexander.com/scala/examples-shows-differences-between-strict-lazy-evaluation-in-scala
object Test1WithFilterLazy extends App {
def lessThan30(i: Int): Boolean = {
println(s"\n$i less than 30?")
i < 30
}
def moreThan20(i: Int): Boolean = {
println(s"$i more than 20?")
i > 20
}
val a = List(1, 25, 40, 5, 23)
val q0 = a.withFilter(lessThan30)
val q1 = q0.withFilter(moreThan20)
for (r <- q1) println(s"$r")
}
- http://exercism.io/exercises/scala/luhn/readme
- Scala如何比较简单地实现这个功能:在一个List[Char]中,如果第一个元素的值为'0', 就去掉它?
- x 单个元素,可能与数学有关。y=f(x)
- xs 多个元素, 一般是list.tail的部分
- p: predicate 常做参数名称。
- c: collection
-
Scala AnyRef == Java Object ( In Scala, Any <- AnyRef, Any <- AnyVal)
-
http://chariotsolutions.com/wp-content/uploads/2016/04/HeatherMiller.pdf
-
顺便复习了一下,Java的super和extends. 举例说明, <? entends Number> 代表是某个继承自Number的类,<? super NaturalNumber>代表的是Number的某个祖先类,可能是父类,也可能是父类的父类。两者的区别
- 你可以想象成树结构,以Number为子节点的树结构。 ? 是集合 {Number, Number的子节点}中的某个元素,?的取值空间就是一个树形结构。List存放的一定是Number某个子类,你不能往里存新的元素,因为从这个说明中,你无从得知它里面具体是什么类。但你取出的元素满足约束:它一定是Number的子类,你可以按照Number的方式操作其中的元素,消费其中的元素。读出的东西有保证,有约束;无法确定什么类型的可以写入。
- 你可以想象成线性结构或者说一条直线, 是由NaturalNumber祖先构成的直线。?是集合{NaturalNumber, NaturalNumber的祖先节点}中的某个元素。?的取值空间就在一条直线上。所以,?的取值一定是自身或者祖先,那么, NaturalNumber一定是?的子类。所以说,NaturalNumber类型的对象一定能放入到List中。 读出的东西没有保证和约束,可能是任意的祖先节点;但是,写入NaturalNumber的时候,能够保证可以,因为具体类型是其某个祖先。
-
一个经典例子
//https://stackoverflow.com/questions/4343202/difference-between-super-t-and-extends-t-in-java
public class Collections {
public static <T> void copy(List<? super T> dest, List<? extends T> src) {
for (int i = 0; i < src.size(); i++)
dest.set(i, src.get(i));
}
}
- twitter scala school 列举了类型系统的相关主题:递归类型,结构类型(其实就是鸭子类型,用到了反射,注意性能)
Type & polymorphism basics
Basic Types and type polymorphism, type inference, variance, bounds, quantification
Advanced types
Advanced Types, view bounds, higher-kinded types, recursive types, structural types
- map.getOrElse() 解决在构建Map时的常见痛点。
- 函数可以作为参数。
- compose 函数和函数间的运算。
- curry. 函数可以按参数分解或者说降维,编程某些参数固定的函数。
- 偏函数。可以和currying类比, currying是去掉一个维度,偏函数是减去一些参数类型值的集合的子集。case语句的本质就是偏函数。
- 举个例子,
object TryScala {
def main(args: Array[String]): Unit = {
println("Hello")
val x = (1 to 10).map(add(1)).map(square)
val y = (1 to 10).map(square _ compose add(1))
println(x)
println(y)
println(s"x == y? ${x==y}")
}
def add(x: Int)(y: Int): Int = {
println(s"$x + $y")
x + y
}
def square(x: Int): Int = {
println(s"$x*$x")
x * x
}
}
- TODO
- http://exercism.io/tracks/scala/exercises/simple-linked-list
- Nothing的作用: * Nothing在构造一些零元的时候非常重要。没有Nothing你是无法构造零元。最好的例子就是Nil就是List[T]的零元。Nil是一个object,类型是List[Nothing]. 而List是协变的, 所以,Nil可以看作是任何类型T对应的List[T]的子类的实例。所以,你做操作, 1::Nil, "AA"::Nil都是合理。这就是零元,他要和相关的任何类型都能兼容。在这个设计中,如果没有Nohting,你是不可以构造出零元的。而零元是什么,为什么需要这个元,请看下一节的解释。 * 之所以需要零元,因为函数式编程语言常常用递归来构造数据结构,而递归的终点就是零元。上面说的List[T]就是一个例子, List[T]的定义就是递归的。但任何递归总有结束的时候,List的递归就是要到一个空的List.而空的List就是递归的终点,就是我的Nil.
- https://en.wikipedia.org/wiki/Covariance_and_contravariance_(computer_science)
- 协变,逆变的意义:
- 类型兼容(安全),代码重用(灵活),有时候,协变或逆变不可行或者带来过多的复杂度,让编程人员无所适从,会做成不变invariant. Set[T]就不变的。Set[Nothing] <: Set[T] 是不成立的。
- 什么叫类型兼容? 从某个视角看,你就是这个类型。比如说,有个方法的签名是 int cacluateWeight(Animal a).如果Cat extends Animal. 那么方法的调用cacluateWeight(new Cat())是能够运行的。 A<:B的内涵就是 如果在某些计算逻辑中,使用了B的引用,如果把这些B的引用换成A的引用,也是合理的。在讨论协变或者逆变的时候,当你被眼花缭乱的解释或者理论说明绕晕时,你就可以使用这个基本原则。 * 此处,我们就是用这个基本原则,去看一下函数的参数的逆变和返回值的协变。在下面的例子中,childFunc是可以赋值给parentFunc, childFunct可以从parentFunc的类型的视角看待,也就是Function1[Animal, Rectangle] <: Function1[Cat, Shape]. 根据上面的原则,我们可以人为,在某些计算逻辑中,使用了parentFunc的引用,我们把它换成childFunc的引用也是合理的。为什么合理呢? 先从入参看,在替换之前,入参传入的肯定都是Cat类或者Cat子类的实例。如果替换成了childFunc, childFunc是以Animal这个视角来处理传入的实例的,而Cat或者Cat子类肯定能够以Animal的视角来处理,因为Cat的子类<:Cat <: Animal。所以,说函数类型的入参是逆变的。为什么不是协变的?协变是行不通的。假如是协变的,那么,就有结论Function1[Cat, Rectangle] <: Function1[Animal, Shape], 再套用上面的方法,如果某段逻辑使用了类型为Function1[Animal, Shape]的引用,我们尝试把这些引用替换为Function1[Cat,Rectangle],那么,在替换之前,传入的参数是Animal的类型,替换之后是入参是Cat的类型,是按照Cat的视角去处理的,因为Cat是Animal的子类,Cat可能具有一些Animal并没有的方法,而Function[Cat,Rectangle]类新的函数正好调用这些Animal不具有的方法,那么,实际传入的可能是Animal类的实例,也可能是Cat的实例,也可能是Animal其他的子类的实例,如果传入的是非Cat的实例,那么,Function1[Cat,Rectangle]会调用入参类型所不具有而Cat具有的方法,这肯定是不安全的,所以说,函数的入参不可能是协变的,入参必须是逆变的。返回值的协变,可以用同样的方法分析出来。
- I learned how to write funtion in covariant type from (http://exercism.io/tracks/scala/exercises/custom-set)
case class CustomSet[+A](list: List[A]) {
def union[B >: A](that: CustomSet[B]): CustomSet[B] = {
//Here, A是协变的, 而that需要逆变,
CustomSet(list.toSet.union(that.list.toSet).toList)
}
def difference[B >: A](that: CustomSet[B]): CustomSet[B] = {
CustomSet(list.toSet.diff(that.list.toSet).toList)
}
def intersection[B >: A](that: CustomSet[B]): CustomSet[B] = {
CustomSet(that.list.toSet.intersect(list.toSet).toList)
}
def insert[B >: A](e: B): CustomSet[B] = {
CustomSet(List(e).toSet.union(list.toSet).toList)
}
def disjoint[B >: A](that: CustomSet[B]): Boolean = {
that.list.toSet.intersect(list.toSet).isEmpty
}
def subset[B >: A](that: CustomSet[B]): Boolean = {
that.list.toSet.intersect(list.toSet) == list.toSet
}
def member[B >: A](e: B): Boolean = {
Set(e).intersect(list.toSet).nonEmpty
}
def empty: Boolean = list.isEmpty
def myEqual[B >: A](that: CustomSet[B]): Boolean = {
that.list.toSet == list.toSet
}
}
private class Animal
private class Cat extends Animal
private class Shape
private class Rectangle extends Shape
object App {
def main(args: Array[String]):Unit = {
var parentFunc: Cat => Shape = (c: Cat) => new Shape
var childFunc: Animal => Rectangle = (a: Animal) => new Rectangle
parentFunc = childFunc
}
}
- trait与抽象类? (https://stackoverflow.com/questions/32958972/trait-vs-abstract-class-in-scala) Try scalac -print
- extends trait == extends object with trait
- extends abstract clss == extends abstatract class extends object
- synchronized.this
- https://twitter.github.io/scala_school/concurrency.html
- Future:
- http://rerun.me/2016/05/29/scala-notes-futures-1/
- http://rerun.me/2016/06/05/scala-notes-futures-2-promises/
- http://rerun.me/2016/06/12/scala-futures-3-combinators-and-async/ Future的组合,错误处理
- Future与Promise? Future是编程者需要直接交互的,而一般情况下,编程者不需要操作Promise. Future是用来读取异步计算逻辑的结果的,Promise是负责将异步执行结果写入Future的。
- 如何配置Future的执行环境(线程池)? Future.apply[T](body: ⇒ T)(implicit executor: ExecutionContext)的第二个参数, 好像要用implicit机制
implicit lazy val fixedThreadPoolExecutionContext: ExecutionContext = { val fixedThreadPool: ExecutorService = Executors.newFixedThreadPool(Runtime.getRuntime.availableProcessors * 2) ExecutionContext.fromExecutor(fixedThreadPool) }
- 对于有依赖关系(flatMap)的Future,如何让它们并发执行?将每个Future都复制到某个变量,然后再用flatMap粘合在一起。Related blog
- Actor (Akka)
- 并发与并行的更深刻的区分: http://chimera.labs.oreilly.com/books/1230000000929/ch01.html#sec_terminology
- 并行只为了效率
- 并发为了一个计算资源服务多个客户,如Web服务器,数据库,不同客户的执行逻辑一般都会相互交织(Interleaved)
- 可以好好理解里面的这段话: While parallel programming is concerned only with efficiency, concurrent programming is concerned with structuring a program that needs to interact with multiple independent external agents (for example, the user, a database server, and some external clients). Concurrency allows such programs to be modular; the thread that interacts with the user is distinct from the thread that talks to the database. In the absence of concurrency, such programs have to be written with event loops and callbacks, which are typically more cumbersome and lack the modularity that threads offer.
- 并发的一种实现方式是多线程,多线程的好处是模块化,程序结构清晰;除了多线程,另外一中典型的并发模型就是事件驱动模型,典型库就是node.js, 一个线程(event loop), 加上各种callback, 模块化差,代码结构不清晰。Netty/Vert.x借鉴了node.js,又是多线程。
- 并行与确定性编程模型,并发与非确定性编程, 各有优缺点。文章的结论,并行与并发结合。
- 并发与并行的更深刻的区分: http://chimera.labs.oreilly.com/books/1230000000929/ch01.html#sec_terminology
- 相关题目
- Ordering extends Comparator.
- Ordered extends Comparable.
- 相关题目:http://exercism.io/exercises/scala/binary-search-tree/readme
- case class
- implicit class
- reflection
- metaprogramming
- quasi-quotation
- macro宏
- 适合多人合作
- 招人成本
- 社区成熟度,问题解决的成本,主流语言的问题,很容易从网上找到答案。
- CPS 或 continuation 类似GOTO, 复杂易错,但是可以提高性能。我认为,非框架或者语言开发者,不应该使用,以为易错和复杂。
- http://blog.bruchez.name/2011/09/continuations-in-scala.html 有益于基于事件的编程。 Contiunation 利用到了Closure.
- CPS, continuation,好像已经过时(2017/11/13),或者说没人维护,也没什么人使用。已被scala.async所替代,https://github.com/scala/scala-async。 注意方向,不要花在过时技术上, 浪费时间。Akka用过CPS,但是已经被废弃。
- 宏是编译期行为,也可以通过宏提高性能
- 纯函数式扩展lib
- scalatest
- scalacheck
- Apache Spark让Scala名声大噪。Akka,用Actor Model构造高并发,容错,可伸缩的,自愈的,高性能的系统。
- Twitter和Linkin用Scala构造出一些很不错了产品。 LinkedIn的消息系统Kafka (据说代码写的漂亮, 主要还是Java,30%是Scala, 不过,core是scala写的), Twitter的RPC调用框架Finagle.
- https://www.zhihu.com/question/28809372
- https://github.com/lauris/awesome-scala
没有买卖就没有杀害,没有对比就没有伤害。有对比,才能以批判的角度看待Scala。
- List按下标获取元素。 Python更方便。list.head vs list[0], list.tail vs list[1:], list.last vs list[-1], list.init vs list[:-1].
- +运算.
- Map的+运算是加入键值对。
scala> Map(1->2) + (3->4)
res1: scala.collection.immutable.Map[Int,Int] = Map(1 -> 2, 3 -> 4)
- List的+运算是字符串拼接。
scala> List(1,2,3) + 2
<console>:12: error: type mismatch;
found : Int(2)
required: String
List(1,2,3) + 2
^
scala> List(1,2,3) + "x"
res3: String = List(1, 2, 3)x
- Scala在List的前后,加元素,你要思考两件事。用什么操作符,加的元素放前面还是放后面。
scala> List(1,2,3):+1
res4: List[Int] = List(1, 2, 3, 1)
scala> 4+:List(1,2,3)
res5: List[Int] = List(4, 1, 2, 3)
- Scala中,冒号的用途
- 声明变量或者函数的类型
scala> val x:Int = 10
x: Int = 10
scala> val add: (Int,Int) => Int = (a,b) => a + b
add: (Int, Int) => Int = $$Lambda$1134/680072609@62a6a47e
- 修饰类型参数: 有时候你会看到 [T:Ordering] [T >: Foo] [T <: Bar]
- 表示运算符是左结合还是右结合。:+,:+.
- List的++ 和 ::: , 可前可后。而::只能前。
scala> List(1,2,3) ++ List(1)
res10: List[Int] = List(1, 2, 3, 1)
scala> List(1,2,3) ++ List(4)
res11: List[Int] = List(1, 2, 3, 4)
scala> List(1,2,3) ::: List(4)
res12: List[Int] = List(1, 2, 3, 4)
scala> List(4) ::: List(1,2,3)
res13: List[Int] = List(4, 1, 2, 3)
scala> List(4) ++ List(1,2,3)
res14: List[Int] = List(4, 1, 2, 3)
scala> 4::List(1,2,3)
res15: List[Int] = List(4, 1, 2, 3)
scala> List(1,2,3)::4
<console>:12: error: value :: is not a member of Int
List(1,2,3)::4
- 无处不在的下划线_ (scala underscore magic: https://stackoverflow.com/questions/8000903/what-are-all-the-uses-of-an-underscore-in-scala)
list.map(_ + 2)
def f[A](a: Pair[A,_])
- import org.hello._
- http://www.jesperdj.com/2016/01/08/scala-access-modifiers-and-qualifiers-in-detail/
- https://alvinalexander.com/scala/how-to-control-scala-method-scope-object-private-package
- https://en.wikibooks.org/wiki/Scala/Packages Package
- Scala有包嵌套的概念,而Java没有。
- Scala可以指定让谁看见 prive[xxx],而Java没有,Java只是符合规则的类,就可以访问。
- Scala消除了一个Java的奇怪设计,不相关的类可以访问某个类的protected成员。